Железо для парсинга на максималке (50 потоков)

Тема в разделе "Свободный форум", создана пользователем ААА, 29 мар 2019.

  1. ААА

    ААА New Member Пользователи

    Регистрация:
    22 янв 2013
    Сообщения:
    21
    Всем привет!

    Задача: имеем сайт с которого нужно парсить информацию. 1 страница около 50кб
    За 1 заход, я прохожу по 100к ссылок, по времени занимает около 100-110 минут
    Имею 3 машины на i7-2шт (озу 16) и на 2 целероне (озу 4). так вот старый селерон работает быстрее всех, хотя по всем характеристикам он слабее i7.

    Сейчас требуется обрабатывать около 1-2 млн линков в день.
    Желательно чтобы это все выполняла машина на 50 потоках, тк сейчас если ставлю более 15, то работа снижается в разы, нежели если поставить 10 потоков.

    Хотелось бы обрабатывать по 100к линков менее чем за час, бюджет на все 100к. рублей.
    Что из железа посоветуете, чтобы быстрее работать с данными х-ками..
    ЗЫ. бюджет можно и по минималке, главное скорость за малые деньги ))
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    В приоритете тактовая частота процессора.

    ОЗУ не влияет (главное, более 4 гБ).
     
    Djahat нравится это.
  3. ААА

    ААА New Member Пользователи

    Регистрация:
    22 янв 2013
    Сообщения:
    21

    какой конфиг можете посоветовать под 50 потоков?
     
  4. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    и я так понимаю количество ядер не влияет на работу Content Downloader, он работает с одним ядром.

    Но вот WBAPP использует все ядра процессора, если я не ошибаюсь.

    +SSD диск ускоряет работу реально (я тестировал) но не совсем понятно, из-за того что пишешь данные на этот диск или в целом программа на нем работает быстрее вместе со всей системой.
     
  5. ААА

    ААА New Member Пользователи

    Регистрация:
    22 янв 2013
    Сообщения:
    21
    вот видимо нет, тк у меня ssd на 10 потоках работает медленее селерона на hdd при равных показателях
     

Поделиться этой страницей