Медленный парсинг exist.ua через прокси

Тема в разделе "Прокси для парсинга", создана пользователем DmitriyV, 11 дек 2020.

  1. DmitriyV

    DmitriyV New Member Пользователи

    Регистрация:
    6 сен 2017
    Сообщения:
    18
    Город:
    Киев
    Добрый день.

    Имеется проблема с парсингом сайта exist.ua

    Парсили товары с сайта, по началу было все хорошо, потом начали банить IP адрес.
    Купили прокси, через время тоже начали банить их.
    Начали использовать мобильные прокси - первых 50 000 товаров спарсили без проблем, со скоростью все было хорошо.

    Сейчас нужно спарсить еще 150 000 товаров.
    Но скорость упала в несколько раз, хотя в самих проси ничего не изменилось.
    Обратили внимание что на сайте изменились все классы, но на границах это не сказалось.

    Подскажите, пожалуйста, из-за чего может быть такая проблема со скоростью и можно как-то ускорить этот процес?
     

    Вложения:

    • problem.jpg
      problem.jpg
      Размер файла:
      76,6 КБ
      Просмотров:
      10
    • problem_2.jpg
      problem_2.jpg
      Размер файла:
      52,8 КБ
      Просмотров:
      8
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Скорость загрузки WEB-документа через прокси зависит от времени, с которым сайт (откуда парсите) ответит прокси-серверу, затем прокси ответит вашему ПК.

    Проблема скорости здесь в соединении ваш ПК -> прокси -> сайт.

    Также учтите, что если при парсинге WEB страница не скачалась, то производится повторная попытка отправки запроса.

    Количество попыток загрузки документов выставляется в окне Ctrl+h.

    То есть, снижение скорости парсинга в вашем случае может быть обусловлена повторными попытками загрузки с прокси, которые медленно срабатывают.

    Других причин, как я знаю, нет.

    Сергей.
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Рекомендую подобрать нужное количество качественных прокси для парсинга этого сайта.
     

Поделиться этой страницей