Фильровать уники по домену

Тема в разделе "Фильтры ссылок", создана пользователем moidodyr66, 25 янв 2013.

  1. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    Подскажите, пожалуйста, как собрать только уникальные домены в сканере сайтов?

    Спрошу в этой же ветке по поводу сканера сайтов:
    Возможно ли прикрутить подачу списка сайтов в сканер сайтов?
     
    Последнее редактирование: 25 янв 2013
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    попробуйте в фильтре ссылок указать только одно условие - вложенность 1 1
     
  3. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    Будьте добры, объясните, что и куда вписать ... при нажатии фильтра ссылок открывается окно настройки фильтров, в каком окне и каким образом задавать условие парсинга уник-доменов. благодарю
     
  4. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    по возможности, кто-нибудь ответьте, пожалуйста, на мой вопрос выше

    подскажите, почему, в силу каких причин, сканер сайтов не может загрузить все ссылки
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте еще раз.
    Ссылки недоступны для гостей полное описание работы сканера сайтов
    Ссылки недоступны для гостей полное описание работы фильтров ссылок
    Если хотите заказать настройку, обратитесь в Skype Kagorec
    Вопрос вы задали абстрактный, а не конкретный. Опишите с какого сайта и что именно собрать.
    Спасибо!
     
  6. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    Да возможно, имея список в главном окне прграммы, передаете в сканер и потом поним будет сканиовать.
    В сканере вобщето вверху один адрес указывается как стартовый а дальше идет глубже и и глубже по ссылкам, тем что в "список очереди" есть.
     
  7. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    собираю ссылки с сайта по определенным признакам, всё отлично собирается, но парсер собирает дубли доменов
    например парсер нашел ссылки

    site.ru/link1
    site.ru/link2
    site.ru/link3

    но мне достаточно только одной из них, как отсеивать такие дубли доменов на этапе сканирования сайта и сбора ссылок?
     
  8. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    PHP:
    http://{get}/|http://{get}
    в поиск замена - в фильтре ссылок или в сканере "поиск-замена"
     
  9. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    благодарю, отлично работает

    в моем случае при парсинге ссылки бывают такого вида:
    site.ru/phpbb2/viewtopic.php?p=1
    site.ru/phpbb2/viewtopic.php?p=2
    site.ru/phpbb2/viewtopic.php?p=3

    как можно отсеять:
    site.ru/phpbb2/viewtopic.php?p=2
    site.ru/phpbb2/viewtopic.php?p=3

    а, оставить первую ссылку в таком виде, как она есть, не обрезая:
    site.ru/phpbb2/viewtopic.php?p=1
     
  10. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.442
    Адрес:
    Latvia
    в поиск-замена
    PHP:
    viewtopic.php?p={skip}|viewtopic.php?p=1
    всему списку
    получите одну потому что уникальна каждая ссылка должна быть
     
  11. moidodyr66

    moidodyr66 New Member Пользователи

    Регистрация:
    14 сен 2011
    Сообщения:
    14
    такой вариант с поиском-заменой в моем случае получается очень трудоемким, детали в файле Ссылки недоступны для гостей
     

Поделиться этой страницей