Расширенное удаление дублей после сбора ссылок

Тема в разделе "Решение различных задач по парсингу", создана пользователем rusalex, 31 мар 2019.

  1. rusalex

    rusalex Active Member Пользователи

    Регистрация:
    22 мар 2018
    Сообщения:
    133
    Город:
    Kiev
    Здравствуйте.
    Помогите с конфигурацией посика-замена в "расширенном удалении дублей" после сбора ссылок на товары.

    Вот такая конфигурация ссылки

    girls-love-kickoff-logo-t-shirt-88024112-481
    нужно до сделать до girls-love-kickoff-logo-t-shirt-88024112 , то есть без -481

    Но!!! И чтобы в ссылках типа girls-love-kickoff-logo-t-shirt-88024112 не удаляло -88024112?
    Вставил так
    -{skip}|

    удаляет, но в ссылках girls-love-kickoff-logo-t-shirt-88024112 удаляет также и последние цифры -88024112 , что нельзя делать!

    Подскажите конфигурацию или где почитать? Спасибо.
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Только три цифры после черточки нужно удалять?
     
  3. rusalex

    rusalex Active Member Пользователи

    Регистрация:
    22 мар 2018
    Сообщения:
    133
    Город:
    Kiev
    Да только три, но есть урлы и без них!
    Буду признателен за помощь!
     
  4. rusalex

    rusalex Active Member Пользователи

    Регистрация:
    22 мар 2018
    Сообщения:
    133
    Город:
    Kiev
    Сделал!!!
    Код:
    re:(\-\d{1,3}$)|
    работает супер!!!!
     
    Последнее редактирование модератором: 2 апр 2019
    cherkas, Root и kagorec нравится это.

Поделиться этой страницей