Парсинг сайтов с большим количеством страниц и данных

Тема в разделе "Решение различных задач по парсингу", создана пользователем Famaga, 30 сен 2019.

  1. Famaga

    Famaga New Member Пользователи

    Регистрация:
    4 июл 2019
    Сообщения:
    15
    Всех приветствую!

    Есть задача, спарсить большое количество сайтов, на которых по 500к+ страниц.
    Соответственно это тянется на месяца. Лицензий на софт хватает.

    Интересует, как можно парсить большое количество данных но не годами)

    Может есть сервера куда можно несколько софта?

    Если парсить в 50 потоков (есть 50 хороших прокси) будет ли эффективно? то есть на много ускорится парсинг в сравнении с, например, 10 потоками?

    За ранее, спасибо за советы и подсказки)
     
  2. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    868
    Можем решить на платной основе, индивидуально в рамках каждого сайта
     

Поделиться этой страницей