Regexp - шпаргалка по регулярным выражениям

Тема в разделе "Решение различных задач по парсингу", создана пользователем kagorec, 19 мар 2012.

  1. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Главное меню - настройка - опции программы. В открывшемся окне перейти во вкладку "RegExpr" и там в единственном текстовом поле прописать:
    С уважением к вам, Сергей.
     
  2. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    Можете не заморачиваться сочетанием ctrl+8
    в системе регулярок есть универсальные рецепты.
    там же в мануале золотые слова -
    Также любой модификатор может меняться с помощью специальной конструкции (?…) внутри регулярного выражения.
    Как раз это - классика регулярок, действующая везде, не только в CD.
    Ее и практикуйте.

    иначе говоря - чтобы сделать формулу
    re:cANon|555
    регистронезависимой - нужно написать ее так -
    re:(?i)cANon|555
    возврат обратно к зависимой формуле
    re:(?-i)cANon|555

    логика простая -
    буква i кажется происходит от слова independent - в переводе с английского "независимый". если же перед ней ставим минус - получается обратный эффект - не-незаивисмый. надеюсь понятно объяснил.

    все остальные модификаторы - gsrmx - прямого отношения к регистронезависимости не имеют.
     
  3. Ohr

    Ohr New Member Пользователи

    Регистрация:
    8 ноя 2015
    Сообщения:
    20
    Спасибо еще раз, разобрался)
    Оказалось дело в Demo версии, вчера купил у вас программу в полной версии все настройки на месте.
     
  4. Renat

    Renat New Member Пользователи

    Регистрация:
    9 ноя 2015
    Сообщения:
    9
    Добрый вечер.
    Пытался очистить русский текст от английских слов с использованием регулярных выражений... В результате удаляются и HTML теги..
    Кто может подсказать как сделать так чтобы теги остались.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Наврятли.
     
  6. fox

    fox New Member Пользователи

    Регистрация:
    16 ноя 2015
    Сообщения:
    2
    При указании в фильтре ссылок выражения
    http:\/\/www\.domen\.ru\/catalog\/[0-9]+\/page[0-9]+\/
    не находит адреса с page1-page10 и дальше page499

    Что не так?
     
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Пробуйте задать для фильтра ссылок сразу две необходимые части.
    Код:
    http://www.domen.ru/catalog/
    re:/page[0-9]+
     
  8. Min-Z-Drav

    Min-Z-Drav New Member Пользователи

    Регистрация:
    14 янв 2015
    Сообщения:
    32
    Подскажите выражение, чтобы поднять регистр первой буквы у каждого слова
    пример:
    яблоко, груша, апельсин
    нужно
    Яблоко, Груша, Апельсин
     
  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    В дополнительные настройки границ, поиск-замена:
    Код:
    re:([^\,\.\;\:\?\s]+)|[REGUPFIRST]$1[/REGUPFIRST]
     
    Root и Min-Z-Drav нравится это.
  10. Min-Z-Drav

    Min-Z-Drav New Member Пользователи

    Регистрация:
    14 янв 2015
    Сообщения:
    32
    Подскажите пожалуйста есть данные:

    текст 23 часть 10.12.2016
    текст 2 часть 10.12.2016

    нужно добавить скобки чтобы получилось

    текст (23 часть) 10.12.2016
    текст (2 часть) 10.12.2016
     
  11. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Здравствуйте
    Если текст всегда отвечает такому формату, то тогда так
    Код:
    re:(.*?\s)(\d+\sчасть)(\s\d+\.\d+\.\d+)|$1($2)$3
     
    Min-Z-Drav и Root нравится это.
  12. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Здравствуйте, подскажите регулярку удалить все кроме артикула, Ссылки недоступны для гостей
     
  13. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Если артикулы только числовые то так
    Код:
    re:^(\d+)(.*?)$|$1
     
  14. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Почему то не срабатывает, Ссылки недоступны для гостей
     
  15. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    скорее всего впереди у вас пробел
    Код:
    re:\s+|\s
    re:^\s(.*?)$|$1
    re:^(\d+)(.*?)$|$1
     
  16. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    если артикул всегда состоит из более 4 цифр тогда можно применить такую регулярку:
    Код:
    re:^[\s\t]*([0-9]{4,100})[\s\t]+.*?$|$1
     
    Arless и Kreol нравится это.
  17. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Все три регулярки применять? Все Ссылки недоступны для гостей стало
     
  18. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    вы что-то не то делаете) пример ссылки
     
    Arless нравится это.
  19. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Сработало, спасибо.
     
    kagorec и Root нравится это.
  20. Arless

    Arless Member Пользователи

    Регистрация:
    8 фев 2015
    Сообщения:
    108
    Может быть, спасибо за помощь.
     

Поделиться этой страницей