Есть ли способ сбора только новых уникальных ссылок при повторном парсинге?

Тема в разделе "Парсинг во вкладке "Ссылки"", создана пользователем bowman, 5 май 2013.

  1. bowman

    bowman New Member Пользователи

    Регистрация:
    10 окт 2012
    Сообщения:
    10
    Приветствую!
    Наверняка этот вопрос уже задавался, не смог найти.
    Хочется при повторных парсингах сайта получать только новые статьи/записи/информацию . Уверен, что можно решить вопрос при помощи других программ на этапе сверения файла ссылок с предыщущими вариантами. Но хочется автоматизации. Есть ли инструмент в этой замечательной программе CD ?
     
  2. maxon

    maxon New Member Пользователи

    Регистрация:
    5 май 2013
    Сообщения:
    2
    На изображении выделен этот элемент. Задаёте текстовый файл, в который будут складываться уже обработанные ссылки, потом при повторном парсинге сайта эти ссылки обрабатываться не будут.
     

    Вложения:

    • Untitled-1.jpg
      Untitled-1.jpg
      Размер файла:
      86,8 КБ
      Просмотров:
      37
  3. bowman

    bowman New Member Пользователи

    Регистрация:
    10 окт 2012
    Сообщения:
    10
    Благодарю. На самом видном месте)))
     
  4. Min-Z-Drav

    Min-Z-Drav New Member Пользователи

    Регистрация:
    14 янв 2015
    Сообщения:
    32
    А в новой версии, где это находиться?
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    ctrl+t -> файл с загруженными ранее ссылками.

    С уважением к вам, Сергей...
     
  6. micol

    micol New Member Пользователи

    Регистрация:
    25 фев 2015
    Сообщения:
    7
    Сергей, а обратно как сделать?

    Ссылки собираются через сканер, но после того, как часть товаров(ссылок) на сайте доноре убирают (например закончились на складе и т.п.) сканер эти ссылки не находит, но по старым ссылкам документы все еще можно открыть, обратившись к ним (и соответственно спарсить, что нет уже товара и т.п.).

    Как сделать так, чтобы и сканер ходил по ссылкам и добавлял их в список для парсинга, и старые ссылки тоже добавлять в список для парсинга, исключая дубликаты естественно?
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Все когда-либо собранные ссылки добавлять в список ссылок главного окна программы. После каждого добавления удалять дубли списка ссылок через контекстное меню. Таким образом, у вас постоянно будут ВСЕ когда-либо собранные ссылки БЕЗ ДУБЛЕЙ.

    С уважением к вам, Сергей...
     

Поделиться этой страницей