Повторяющиеся границы

Тема в разделе "Решение различных задач по парсингу", создана пользователем denniseds, 6 июл 2014.

  1. denniseds

    denniseds New Member Пользователи

    Регистрация:
    6 июл 2014
    Сообщения:
    9
    Доброго времени суток.
    Возникла следующая проблемка, необходимо использовать "повторяющиеся границы" на подгружаемой страничке, использование <GETMORECONTENT> видимо необходимо, но не получается туда вписать <CD_CYCLE_GRAN_2!>, как быть? или как правильно вписать?

    А вообще задача следующая, надо в первом цикле подгружать страницу, с которой парсить вторым циклом данные, возвращаться в первый цикл, получать другой урл, парсить вторым циклом и т.д.
     
    Последнее редактирование: 6 июл 2014
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.
    Трудно было понять, что требуется, но, вроде, понял. Нет, так нельзя.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Можно всегда найти другой путь...
     
  4. denniseds

    denniseds New Member Пользователи

    Регистрация:
    6 июл 2014
    Сообщения:
    9
    Будем искать :)

    На всякий случай, выглядит это так примерно:

    Основная страница
    Урл1 Данные Данные
    Данные по Урл1 Данные по Урл1 Данные по Урл1
    Урл2 Данные Данные
    Данные по Урл2 Данные по Урл2 Данные по Урл2
    Урл3 Данные Данные
    Данные по Урл3 Данные по Урл3 Данные по Урл3

    Вот я и хотел двумя циклами спарсить все это.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Тогда вам нужно прописать макрос [GETMORECYCLECONTENT] (смотрите его краткое описание в дереве макросов редактора шаблона вывода (ctrl+2)) в настройке повторяющихся границ парсинга (ctrl+5 или shift+ctrl+5). Тогда вы будете в каждом [GETMORECYCLECONTENT] использовать ссылку (Урл1, Урл2...) из повторяющихся границ.
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Поставили бы конкретную задачу, постарался бы дать вам конкретное решение, а так мы можем ходить вокруг да около бесконечное число времени.
     
  7. denniseds

    denniseds New Member Пользователи

    Регистрация:
    6 июл 2014
    Сообщения:
    9
    Ставлю конкретную задачу, спасибо что помогаете.

    Вот пример страницы которую нужно распарсить:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    И схемку набросал, что примерно нужно, и как я это вижу:


    [​IMG]

    т.е. нужно спарсить данные из строки 1.1, перейти по ссылке и спарсить все строки поочередно, потом то же самое со строкой 1.2 и т.д.
     
    Последнее редактирование: 7 июл 2014
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.

    Тут лучше в два прохода парсить. Вот я вам настроил первый проход (меню - файл - загрузить проект).

    Там мы получаем ссылку на подгружаемые данные и то, что вам нужно парсить с указанной ссылки.

    Вторым проходом вы будете парсить уже по этим найденным сылкам на подгружаемые данные.

    Получившиеся два CSV склеите по колонке "Ссылка на подгружаемые данные" в редакторе CSV файлов (кнопка на панели инструментов) функцией "выполнить слияние...".

    Надеюсь, вам будет понятно.

    Если будут вопросы - пожалуйста, обращайтесь.
     

    Вложения:

  9. denniseds

    denniseds New Member Пользователи

    Регистрация:
    6 июл 2014
    Сообщения:
    9
    Спасибо большое :)
     
  10. denniseds

    denniseds New Member Пользователи

    Регистрация:
    6 июл 2014
    Сообщения:
    9
    Еще возник вопрос, можно ли как то сохранять при парсинге повторяющихся границ, каждую строку в отдельный файл?
    например спарсили строку 1.1 - сохранили, спарсили строку 1.2 - сохранили в другой файл и т.д.

    Ну или если не повторяющимися границами, то может быть как то по другому можно это выполнить?
     
  11. denniseds

    denniseds New Member Пользователи

    Регистрация:
    6 июл 2014
    Сообщения:
    9
    Ауу, где все??
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Можно.
    Нажмите shift+ctrl+5 (настройка повторяющихся границ) и пропишите туда примерно следующее:
     

Поделиться этой страницей