Как парсить samsung.ru

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем eugen, 13 фев 2014.

  1. eugen

    eugen Member Пользователи

    Регистрация:
    1 фев 2014
    Сообщения:
    35
    Добрый день. Скажите, пожалуйста, как парсить сайт Samsung.ru?
    Основная пробелма в том, что на списке товаров для навигации по страницам используется аякс запросы и результаты не отражаются в браузере.
    Ссылки недоступны для гостей

    Подскажите, как получить все ссылки на детальные страницы каждого товара в таком случае?
    Спасибо!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Ctrl+h -> включить Internet Explorer (DOM). Будет обрабатывать и аякс.

    Либо смотреть с каких URL подгружаются ссылки на товары плагином Firefox LiveHTTPHeaders и парсить с этих самых URL (полученных плагином).
     
  3. eugen

    eugen Member Пользователи

    Регистрация:
    1 фев 2014
    Сообщения:
    35
    Ну с большего получилось, только если при сборе ссылок не ставить галочку "не пополнять очередь", тогда вроде собирает. Если этот чекбокс нажать, то все равно мало собирает, только первую видимую выдачу.

    Скажите, а как быть с таким сайтом как lg.com Там картинки подгружаются аяксом в момент, когда мы скролим страницу. Пробовал указать в футере ID блока для клика (думал, что по логике браузером будет прокручиваться жо футера и там кликаться- Видимо не так это работает) и использовать internet explorer DOM, но все равно картинки не закачивает.
    Вот примерная ссылка Ссылки недоступны для гостей
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Смотреть с каких URL подгружаются картинки плагином Firefox LiveHTTPHeaders.
     

Поделиться этой страницей