проблема с удалением дублей

Тема в разделе "Фильтры ссылок", создана пользователем phederal, 23 ноя 2015.

  1. phederal

    phederal New Member Banned

    Регистрация:
    3 окт 2015
    Сообщения:
    18
    С толкнулся с такой проблемой, в разделе ссылки указал путь для сохранения ссылок, при парсинге контента все удаляется, при том что ссылки не повторяются. Так же в разделе контент парсится на сайт пост запросом, файлы не сохроняет
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Обратитесь к специалистам по настройке Ссылки недоступны для гостей
    Пусть посмотрят, в чем проблема. Спасибо!
     
  3. phederal

    phederal New Member Banned

    Регистрация:
    3 окт 2015
    Сообщения:
    18
    Так они мне и настроили, сказали у вас спросить почему так?
     
  4. phederal

    phederal New Member Banned

    Регистрация:
    3 окт 2015
    Сообщения:
    18
    Суть проблемы, при сохранении ссылок после сбора в разделе ссылки, потом идет парсинг контента и проверяется файл с раздела ссылок, и почему то в разделе контент они сразу пропадают, как ее решить?
     
  5. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Об одной проблеме создали несколько тем). Достаточно одной.
    Обычно проблема в непонимании как работает программа.
    Извините но можно было бы поподробнее вот этот шедевр расписать?
    Если разобрать по цитатам и попробовать разьяснить, может проблемы то и нет:
    оно вам надо? всеравно если периодичеки собираете ссылки то пусть собирает, поскольку важно напримерт если появилось чтото новое на источнике.
    При парсинге во кладке "контент" список ссылок удалается поосле обработки.
    Не будут повторяться и не должны, это стоит учесть (например в том случае когда вы хотите напарсить товар который находиться сразу в нескольких категорий и категории указаны в PARAM и т.д.). При сборе ссылок во вкладке "ссылки" и в сканере - ссылки одинаковые исключатся, остается список с уникальными.
    Обычное дело когда импортируется контент в базу то незачем сохранять файл на компе, НО для проверки повторного парсинга всетаки надо чтоб файл сохранялся но компе (можно например занголовок или артикул сохранять там) чтобы C.D. не писал в логе "результатирующий документ остался пустым" что для проверки воспримется так что надо будет парсить еще раз потом. (тоесть при пустом файле не записывает в проверочный файл txt ссылку - вам сегодня показал принцип тут )
     

Поделиться этой страницей