Дубли ссылок как убрать

Тема в разделе "Сбор ссылок сканером сайтов", создана пользователем Werter1, 1 дек 2020.

  1. Werter1

    Werter1 New Member Пользователи

    Регистрация:
    20 ноя 2019
    Сообщения:
    31
    Всем привет!
    Собираю ссылки с новостных сайтов, в итоге попадаются дули ссылок после работы сканера, замечаю это после того как контент распорсил. Сделал в один поток, всё равно дубли.

    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Прикладываю проект.

    что я делаю не так?
     

    Вложения:

    • inosmi_ru.cdp
      Размер файла:
      40,4 КБ
      Просмотров:
      1
  2. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    Это не дубли. Протокол отличается http и https. Сделайте поиск замену в фильтре ссылок "http:|https:"
     
    kadishev1997, Root и Werter1 нравится это.

Поделиться этой страницей