Сканер сайтов с огромным количеством страниц

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем Twist6, 17 апр 2017.

  1. Twist6

    Twist6 Member Пользователи

    Регистрация:
    13 ноя 2016
    Сообщения:
    37
    Добрый всем день. Посоветуйте как можно внешние ссылки собрать с сайта, который 2-3 миллиона страниц? На определенном этапе в заголовке программы появляется ошибка, что то типа памяти не хватает...
    Частями парсить не получается т.к. списка всех внутренних ссылок нет.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Сколько бит система?
    Какая версия программы?
     
  3. Twist6

    Twist6 Member Пользователи

    Регистрация:
    13 ноя 2016
    Сообщения:
    37
    Система 64 бит, 12 гб оперативы - Ультиматум
    Версия программы 11.1
     
    Последнее редактирование: 17 апр 2017
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Настройте фильтры очереди таким образом, чтобы она не росла сильно (не попадали лишние ссылки). Программе выделяется до 2,5 ГБ оперативной памяти, следите, чтобы этот лимит не превышался.
     
    Twist6 нравится это.
  5. Twist6

    Twist6 Member Пользователи

    Регистрация:
    13 ноя 2016
    Сообщения:
    37
    Хорошо, буду пробовать. А регулировать лимит выделяемой оперативной памяти нельзя будет внедрить в настройки?
    Чтобы кому это реально нужно, мог расширить допустим до 5-6гб.
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Только если сделать 64-бит версию программы. Но мы пока не можем использовать новый компилятор, так как некоторые компоненты с ним не работают.
     
    Twist6 нравится это.

Поделиться этой страницей