Парсинг 220-volt.ru - реально ли?

Тема в разделе "Решения по парсингу популярных сайтов", создана пользователем kadishev1997, 8 окт 2019.

  1. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Здравствуйте!

    Есть сайт 220-volt.ru .

    Главная страница открывается только через win (beta) или wbapp.

    Страницы с товарами подгружаются только через wbapp (по крайней мере у меня). Через другие методы (INDY, CIS и WIN) показывает только код, который пытается подгрузиться по js (скорее всего, возможно ошибаюсь). Ко всему этому, программа подзависает при переходе на товар (видимо, пытается загрузить что-то) вплоть до 2х минут, тестировал на разных машинах.

    Страница одного из товаров - 220-volt.ru/catalog-95124/ (посмотреть можно любой товар, разницы нету)

    Вопрос: можно ли сделать нормальную загрузку кода НЕ через wbapp? Возможно, нужно декодирование или какая-то подгрузка (посмотрел GET и POST-запросы в Mozilla, в них не смог найти что-то необходимое, но чую что ответ кроется где-то в них)
     
    Последнее редактирование: 8 окт 2019
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Без браузера этот сайт навряд ли спарсить.

    Пользуйтесь WBAppCEF

    Ссылки недоступны для гостей
     
    kadishev1997 нравится это.

Поделиться этой страницей