Подскажите парсинг анонсов с поисковика

Тема в разделе "Решение различных задач по парсингу", создана пользователем wcw2007, 6 апр 2017.

  1. wcw2007

    wcw2007 Member Пользователи

    Регистрация:
    15 мар 2017
    Сообщения:
    126
    Суть задачи программа пробегает по выдаче рамблер выдергивает ссылки на статьи и с помощью getmorecontent получает по статье и обрезает ее до n значения т.е. анонсы

    Вот шаблон
    <CD_CYCLE_GRAN_1!>
    <GETMORECONTENT><URL="<CD_CYCLE_GRAN_1!>"><START=""><STARTCOUNT="0"><END=""><ENDCOUNT="0"><PARAMS="tocsv,auto"></GETMORECONTENT>

    Значение <CD_CYCLE_GRAN_1!> class="b-serp-item__link" href=" здесь адрес ссылки"

    Не пойму почему вместо статей парсятся адреса сайтов url?

    Ссылка для парсинга пример
    Ссылки недоступны для гостей
     

    Вложения:

    • ECODIXAIN.cdp
      Размер файла:
      390,4 КБ
      Просмотров:
      1
  2. wcw2007

    wcw2007 Member Пользователи

    Регистрация:
    15 мар 2017
    Сообщения:
    126
    Такой код тоже не работает
    <GETMORECONTENT><URL="[VALUE]"><START=""><STARTCOUNT="0"><END=""><ENDCOUNT="0"><PARAMS="tocsv,auto"></GETMORECONTENT>
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Все работает, если правильно делать.

    2017-04-07_06-06-35.png
     

    Вложения:

    • ECODIXAIN.cdp
      Размер файла:
      390,7 КБ
      Просмотров:
      2
    Kreol нравится это.

Поделиться этой страницей