Фильтрация ссылок одинаковой вложенности

Тема в разделе "Фильтры ссылок", создана пользователем loman, 18 окт 2017.

  1. loman

    loman New Member Пользователи

    Регистрация:
    9 ноя 2016
    Сообщения:
    42
    Здравствуйте.
    Спарсились у многого товара по две ссылки,с одинаковым содержимым.
    1)Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    2)Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    Во второй ссылке мне нравиться вложения категорий(хл крошки),он более полный.
    Как отсеять первый тип ссылок?
     
  2. napserious

    napserious Well-Known Member Пользователи Активирован

    Регистрация:
    16 окт 2015
    Сообщения:
    224
    К сожалению данные товары добавлены в обе категории и автоматически отсеять их нельзя,
    так как парсер распознает их как 2 разных товара.
    Хотя в коде есть ID товара который одинаковый и можно потом удалять дубликаты.
    Была такая же задача.
     
  3. loman

    loman New Member Пользователи

    Регистрация:
    9 ноя 2016
    Сообщения:
    42
    А потом эт на какой стадии? Объясни пожалуйста,не догоняю
     
  4. aresa

    aresa Well-Known Member Пользователи

    Регистрация:
    17 окт 2015
    Сообщения:
    106
    есть макрос
    [DUPIGNORE][KEY]<CD_GRAN_1!>[/KEY][CSVCS]<NIMG><CD_GRAN_2!></NIMG>[CSVCS][VERTTABLE][PREFIX][/PREFIX][MIN]2[/MIN]<CD_GRAN_3!>[/VERTTABLE][/DUPIGNORE]
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме!
    причем в [KEY] можно оборачивать несколько границ. Например артикул, название, цена. Или один артикул, если он однозначно определяет товар.
    Если по [KEY] попадется повтор, вся строка вывода уйдет в игнор, т.е. отсеится.
     
    Root нравится это.
  5. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.623
    Город:
    Сочи
    Также можно сделать фильтр по количеству вложенных рубрик товара, если это интересно, пишите.
     
  6. loman

    loman New Member Пользователи

    Регистрация:
    9 ноя 2016
    Сообщения:
    42
    Забегался,во время не ответил...
    Да ,оба варианта интересны.Объясните пожалуйста детально что куда
     
  7. loman

    loman New Member Пользователи

    Регистрация:
    9 ноя 2016
    Сообщения:
    42
    Здравствуйте.Спасибо за помощь,только мне не дошло увы).Этот макрос для какой границы? Допустим в проекте название товара-это <CD_GRAN_1!> ,и фильтровать по нему будем ,а в вашем примере <CD_GRAN_2!> уже результат за минусом дублей,или как?
     
  8. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.623
    Город:
    Сочи
    2017-10-21_08-21-03.png
     

    Вложения:

    • unikma_ru.cdp
      Размер файла:
      334,6 КБ
      Просмотров:
      1
  9. loman

    loman New Member Пользователи

    Регистрация:
    9 ноя 2016
    Сообщения:
    42
    Здравствуйте.Не нашел в системе помощи об этом макросе. По какому принципу он работает,по глубине ссылок?
     
  10. loman

    loman New Member Пользователи

    Регистрация:
    9 ноя 2016
    Сообщения:
    42
    Напишите пожалуйста что с вашим проектом делать? Он как самостоятельный,для отсева дублей или это образец?
     
  11. Root

    Root Администратор Команда форума Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    9.623
    Город:
    Сочи
    Как и писал выше, по количеству рубрик товара. Проект загружать в программе.
     

Поделиться этой страницей