Работа фильтра списка очереди ссылок

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем Orvin, 10 июл 2015.

  1. Orvin

    Orvin New Member Пользователи

    Регистрация:
    6 июл 2015
    Сообщения:
    28
    Здравствуйте!

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    1) Поймите разницу между фильтрами очереди и фильтрами ссылок. Вот материал системы помощи по сканеру сайтов с графической схемой Ссылки недоступны для гостей

    2) Достаточно просто указать /ru и глубину ссылок от 3 до 3 (простите, в регулярных выражениях я не разбирался)

    С уважением к вам, Сергей.
     
  3. Orvin

    Orvin New Member Пользователи

    Регистрация:
    6 июл 2015
    Сообщения:
    28
    спасибо, изучу, пожелания: в программе очень удобно было бы сразу ссылки на нужные разделы мануала давать, например, как это сделано в кейколлекторе

    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
     
  4. Orvin

    Orvin New Member Пользователи

    Регистрация:
    6 июл 2015
    Сообщения:
    28
    я правильно понял, что если добавить любой стартовый URL содержащий в себе ссылку на главную страницу, то без дополнительных фильтров будет сканироваться весь сайт? По сути невозможно просканировать какой то отдельный каталог сайта при структуре расположения ссылок на товары без категорий? т.е. адрес_сайта/товар
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    1) судя по скриншоту все правильно по вашим указаниям для списка очереди сканер собрал.

    2)
    Было странно еслиб работало с неправильной регуляркой)
    Пробуйте так:
    Код:
    re:^http\://[^\/]+/[^\/]+/ru
     

Поделиться этой страницей