Пропускаются товары при парсинге.

Тема в разделе "Решение различных задач по парсингу", создана пользователем vladimir4000, 7 июл 2020.

  1. vladimir4000

    vladimir4000 Member Пользователи

    Регистрация:
    25 авг 2017
    Сообщения:
    119
    День добрый, не могу разобраться почему не парсяться некоторые товары в случайном порядке. Предполагаю что проблема в WBApp, менял различные настройки - увеличивал паузу между запросами, устанавливал один поток, увеличивал таймаут проверки загрузки документа в окне настройки WBApp, увеличивал runDeley в этом же окне, но все равно не всегда срабатывает WBApp и следовательно получаю пустой документ. Хотя при предпросмотре и задании границ парсинга документа все в порядке. Может у кого есть еще какие идеи?
     

    Вложения:

  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    В логе вам пишет причину изза чего пропустило. Проверьте границы 1 и 4 на тех ссылках изза чего не находит.
     
  3. vladimir4000

    vladimir4000 Member Пользователи

    Регистрация:
    25 авг 2017
    Сообщения:
    119
    Они пустые потому, что не прогрузился WBApp, если зайти через предпросмотр или через окно где указываешь границы парсинга, то все прогружается нормально, если же не сработал WBApp, то соответственно границы пустые а 1 и 4 обязательны для загрузки.
     
  4. vladimir4000

    vladimir4000 Member Пользователи

    Регистрация:
    25 авг 2017
    Сообщения:
    119
    Видимо не хватало оперативной памяти компьютера для WBApp, убрал все лишние приложения. Так же увеличил паузу между запросами, установил один поток, увеличил таймаут проверки загрузки документа в окне настройки WBApp, увеличил runDeley в этом же окне, в диспетчере задач приложению Content Downloader X1 повысил приоритет, загрузка прошла без проблем.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Посмотрите видео Ссылки недоступны для гостей (Ожидание готовности загрузки WEB-страниц)
     
    vladimir4000 нравится это.

Поделиться этой страницей