Помогите распарсить сайт с java пагинацией

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Magnum, 17 июн 2013.

  1. Magnum

    Magnum New Member Пользователи

    Регистрация:
    18 апр 2013
    Сообщения:
    4
    Вот собственно пациент - Ссылки недоступны для гостей

    Пагинация не явная, а через js. Отключаешь js - ни товаров ни пагинации.

    Задача собрать ссылки страниц для парсинга контента

    Как сделать ума не приложу. Подскажите у кого какие идеи
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Отснифить/поймать запрос при клике по странице с помощью Mozilla +addon HTTPFox
    Будут ссылки вида
    Код:
    http://tyreinfo.com/jsonservice.php?action=searchTyre&dataType=json&page=3&width=-1&profile=-1&diameter=-1&index_speed=-1&index_load=-1&stud=-1&type=-1&season=-1
    Добавляете в CD во вкладке "ссылки" диапазон ставите и потом с отмеченным обработчиком sitemap.xml собираете ссылки

    [​IMG]

    Лишние экранируемые слеши удалить с помощью фильтра в поле "поиск-замена"
    Код:
    \/|/
     
    Последнее редактирование: 17 июн 2013
  3. xmaster

    xmaster New Member Пользователи

    Регистрация:
    26 янв 2017
    Сообщения:
    11
    Подскажите пожалуйста где тут
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    нужный POST запрос?
    После клика есть только один подходящий POST запрос /bitrix/templates/vamsvet_new/system/ddl_ajax.php HTTP/1.1, но в нем нет ни пагинации, ни данных как в видео.
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    2017-09-07_10-23-18.png
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
    xmaster нравится это.
  5. xmaster

    xmaster New Member Пользователи

    Регистрация:
    26 янв 2017
    Сообщения:
    11
    Спасибо, только я дальше не сдвинулся. В настройках HTTP запросов нужны POST запросы, а тут GET. Прямая ссылка
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    выводит абракадабру, по ней парсер ничего не соберет. Выходит что в программе как-то нужно связать запрос GET и запрос POST ( /bitrix/templates/vamsvet_new/system/ddl_ajax.php ) ?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Никаких проблем не вижу.

    2017-09-07_12-04-09.png
     

    Вложения:

    • vamsvet_ru.cdp
      Размер файла:
      34,5 КБ
      Просмотров:
      4
    xmaster нравится это.
  7. xmaster

    xmaster New Member Пользователи

    Регистрация:
    26 янв 2017
    Сообщения:
    11
    От души! Я думал сегодня не успею. Лучшая поддержка из всех что мне встречались. Быстро, коротко и в точку, без демагогий.
     

Поделиться этой страницей