Парсинг контента

Тема в разделе "Решение различных задач по парсингу", создана пользователем Alexei82, 22 фев 2017.

  1. Alexei82

    Alexei82 New Member Пользователи

    Регистрация:
    22 фев 2017
    Сообщения:
    19
    Добрый день, подскажите, пожалуйста.
    Попытаюсь объяснить..
    Есть страница откуда парсятся данные в виде
    <CD_GRAN_1!>[CSVCS]<CD_GRAN_2!>[CSVCS]<CD_CYCLE_GRAN_3!>

    где <CD_CYCLE_GRAN_3!> - тут задан парсинг ссылок из область заданных в <CD_GRAN_3!> - где идут ссылки списком и + нужно вытянуть часть контента из этих ссылок и все записать в отдельную строку

    1. как вытянуть часть контента из спарсеной ссылки в <CD_CYCLE_GRAN_3!> и записать рядом с этой ссылкой?
    2. на выходе мне нужно файлик в таком формате
    upload_2017-2-22_13-20-23.png
    Помогите разобраться
    Спасибо!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Действовать по аналогии с этим методом Ссылки недоступны для гостей

    PS: У вас в столбце D ячейки объединены, в CSV такого быть не может.

    С уважением к вам, Сергей.
     
    Alexei82 нравится это.
  3. Alexei82

    Alexei82 New Member Пользователи

    Регистрация:
    22 фев 2017
    Сообщения:
    19
    ок, спасибо, еще вопросик,

    у меня есть <CD_CYCLE_GRAN_2!> например и он выдает готовый список ссылок в виде -

    ссылка, ссылка, ссылка, ссылка, ... - 10 штук прямых ссылок,
    как задать теперь, чтобы по этим ссылкам из <CD_CYCLE_GRAN_2!> парсить дополнительный контент?

    Код:
    <GETMORECONTENT><URL="<CD_CYCLE_GRAN_2!>"><START="<li>{br}                        {br}                            <span class={"}{"}>"><STARTCOUNT="1"><END="</span>"><ENDCOUNT="0"><PARAMS=""></GETMORECONTENT>
    
    [GETMORECYCLECONTENT]Ссылки недоступны для гостей[START]<li>{br}                        {br}                            <span class={"}{"}[/START][END]</span>[/END][TOSTART][/TOSTART][TOEND][/TOEND][PARAMS][/PARAMS][SEP]{br}[/SEP][/GETMORECYCLECONTENT]
    
    два варианта ничего не дают..

    Спасибо.
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.

    Ссылки недоступны для гостей обратите внимание на большие красные буквы. Пользуйтесь логом выполнения функций в окне предпросмотра результатов парсинга контента (в нижней части окна).

    С уважением к вам, Сергей.
     
    Последнее редактирование: 23 фев 2017
    Alexei82 нравится это.

Поделиться этой страницей