Как сканер работает с дублями ссылок?

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем Stan, 25 июл 2017.

  1. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    Здравствуйте.

    При сканировании, в выдачу не попадают дубли ссылок, как я понимаю.
    А если ссылки имеют параметр PARAM, то дубли тоже не пройдут?
    Можно ли отключить удаление дублей ссылок, чтоб в выдаче были дублированные ссылки?

    Я паршу ссылки на товары и в PARAM беру названия категорий, один и тот же товар может встречаться в разных категориях, и нужно чтобы дубли не удалялись.

    т.е.
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    не считались дублями.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Дубли ссылок в выдачу попадать не будут (даже при наличии различного [PARAM]).
     
  3. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    :D
    так мне нужны эти дубли, нужно чтобы дубли оставались, а не удалялись.
    есть такая возможность?
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Нет. Я выше писал об этом.
     
  5. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    ок. т.е. может доработка или что-то подобное не предвидеться ? возможность оставить дублированные ссылки в выдаче логичная функция, я думаю многим пригодится.

    есть сайты, у которых просто так не возьмешь категорию кроме как сканер-парам, либо нужно взять дополнительные категории для товара, т.е. один и тот же товар ( и у него одинаковый урл, только хлебные крошки разные) . А сканер их удаляет получается. Берет только одну ссылку.
     
  6. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Для получения дублей используйте не сканер и не вкладку ссылки, а вкладку "Контент" настроенную на получение ссылок с помощью повторяющихся границ
     
    lazer, Serheo и Stan нравится это.

Поделиться этой страницей