Повторяющиеся границы

Discussion in 'Решение различных задач по парсингу' started by denniseds, Jul 6, 2014.

  1. denniseds

    denniseds New Member Пользователи

    Joined:
    Jul 6, 2014
    Messages:
    9
    Likes Received:
    0
    Доброго времени суток.
    Возникла следующая проблемка, необходимо использовать "повторяющиеся границы" на подгружаемой страничке, использование <GETMORECONTENT> видимо необходимо, но не получается туда вписать <CD_CYCLE_GRAN_2!>, как быть? или как правильно вписать?

    А вообще задача следующая, надо в первом цикле подгружать страницу, с которой парсить вторым циклом данные, возвращаться в первый цикл, получать другой урл, парсить вторым циклом и т.д.
     
    Last edited: Jul 6, 2014
  2. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Likes Received:
    3,485
    Здравствуйте.
    Трудно было понять, что требуется, но, вроде, понял. Нет, так нельзя.
     
  3. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Likes Received:
    3,485
    Можно всегда найти другой путь...
     
  4. denniseds

    denniseds New Member Пользователи

    Joined:
    Jul 6, 2014
    Messages:
    9
    Likes Received:
    0
    Будем искать :)

    На всякий случай, выглядит это так примерно:

    Основная страница
    Урл1 Данные Данные
    Данные по Урл1 Данные по Урл1 Данные по Урл1
    Урл2 Данные Данные
    Данные по Урл2 Данные по Урл2 Данные по Урл2
    Урл3 Данные Данные
    Данные по Урл3 Данные по Урл3 Данные по Урл3

    Вот я и хотел двумя циклами спарсить все это.
     
  5. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Likes Received:
    3,485
    Тогда вам нужно прописать макрос [GETMORECYCLECONTENT] (смотрите его краткое описание в дереве макросов редактора шаблона вывода (ctrl+2)) в настройке повторяющихся границ парсинга (ctrl+5 или shift+ctrl+5). Тогда вы будете в каждом [GETMORECYCLECONTENT] использовать ссылку (Урл1, Урл2...) из повторяющихся границ.
     
  6. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Likes Received:
    3,485
    Поставили бы конкретную задачу, постарался бы дать вам конкретное решение, а так мы можем ходить вокруг да около бесконечное число времени.
     
  7. denniseds

    denniseds New Member Пользователи

    Joined:
    Jul 6, 2014
    Messages:
    9
    Likes Received:
    0
    Ставлю конкретную задачу, спасибо что помогаете.

    Вот пример страницы которую нужно распарсить:
    Hidden Content:
    **Hidden Content: To see this hidden content your post count must be 1 or greater.**
    И схемку набросал, что примерно нужно, и как я это вижу:


    [​IMG]

    т.е. нужно спарсить данные из строки 1.1, перейти по ссылке и спарсить все строки поочередно, потом то же самое со строкой 1.2 и т.д.
     
    Last edited: Jul 7, 2014
  8. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Likes Received:
    3,485
    Пожалуйста.

    Тут лучше в два прохода парсить. Вот я вам настроил первый проход (меню - файл - загрузить проект).

    Там мы получаем ссылку на подгружаемые данные и то, что вам нужно парсить с указанной ссылки.

    Вторым проходом вы будете парсить уже по этим найденным сылкам на подгружаемые данные.

    Получившиеся два CSV склеите по колонке "Ссылка на подгружаемые данные" в редакторе CSV файлов (кнопка на панели инструментов) функцией "выполнить слияние...".

    Надеюсь, вам будет понятно.

    Если будут вопросы - пожалуйста, обращайтесь.
     

    Attached Files:

  9. denniseds

    denniseds New Member Пользователи

    Joined:
    Jul 6, 2014
    Messages:
    9
    Likes Received:
    0
    Спасибо большое :)
     
  10. denniseds

    denniseds New Member Пользователи

    Joined:
    Jul 6, 2014
    Messages:
    9
    Likes Received:
    0
    Еще возник вопрос, можно ли как то сохранять при парсинге повторяющихся границ, каждую строку в отдельный файл?
    например спарсили строку 1.1 - сохранили, спарсили строку 1.2 - сохранили в другой файл и т.д.

    Ну или если не повторяющимися границами, то может быть как то по другому можно это выполнить?
     
  11. denniseds

    denniseds New Member Пользователи

    Joined:
    Jul 6, 2014
    Messages:
    9
    Likes Received:
    0
    Ауу, где все??
     
  12. Root

    Root Администратор Администратор

    Joined:
    Mar 10, 2010
    Messages:
    14,818
    Likes Received:
    3,485
    Можно.
    Нажмите shift+ctrl+5 (настройка повторяющихся границ) и пропишите туда примерно следующее:
     

Share This Page