Почему через WBApp парсить только в 1 поток?

Тема в разделе "WBAppIE", создана пользователем Serheo, 6 мар 2019.

  1. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    В системе помощи НАСТОЯТЕЛЬНО рекомендуется парсить через WBApp только в 1 поток. А какие последствия могут быть от увеличения количества потоков кроме тормозов?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    "Примите вызов" - ведь правила созданы чтоб их нарушать?)) - шучу.;)

    В основном рекомендуется парсить без применения Wbapp. Поскольку 1 поток используя Wbapp и этого покажется мало\долго. Поставите 10-50 и компьютер будет зависать (Wbapp обрабатывает DOM).
     
    Последнее редактирование: 7 мар 2019
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Просто в открытых во множестве параллельно копиях браузера могут не успевать прогружаться и обрабатываться сайты.
     
    kagorec нравится это.
  4. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    А как это определить по логам?
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Анализировать результат парсинга. Нет ли пропусков информации.
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В логе (ctrl+l) есть отображение записываемых в документ символов (при парсинге каждой ссылки).
     
  7. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Спасибо за наводку! Поковыряю результаты. На вид все нормально, но есть подозрения.
     
    kagorec и Root нравится это.

Поделиться этой страницей