Regexp - шпаргалка по регулярным выражениям

Тема в разделе "Решение различных задач по парсингу", создана пользователем kagorec, 19 мар 2012.

  1. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ссылки недоступны для гостей
     
  2. Stan

    Stan Active Member Пользователи

    Регистрация:
    15 июн 2011
    Сообщения:
    499
    Здравствуйте.

    Такие строки - КАТЕГОРИЯ|Подкатегория , или КАТЕГОРИЯ|ПОДКАТЕГОРИЯ, и нужно привести регистры букв в один вид Категория|Подкатегория.
    Где Подкатегория с заглавной идет
     
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Замените файл Content Downloader.exe (в папке с программой) этим файлом:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Код:
    [REGUPFIRST][WORDMODE][REGDOWN]КАТЕГОРИЯ|ПОДКАТЕГОРИЯ[/REGDOWN][/REGUPFIRST]
     
    xLime, Stan и napserious нравится это.
  4. rusalex

    rusalex Active Member Пользователи

    Регистрация:
    22 мар 2018
    Сообщения:
    133
    Город:
    Kiev
    Здравствуйте. Подскажите как в регулярных выражениях длину, ширину, высотц в д.ймах перевести в сантиметры?
    В описании мера длины дюйм

    Я помощью РВ я выделяю нужные цифры но перевести в дюйм, т.е. умножить на 2,54 не могу

    Текст

    10.25 cm front rise. 14.5" back rise.
    16.5" leg opening. Inseams available: 30", 32", 34".

    Вот такое выражение

    Код:
    re:(\d{1,2}\.\d{1,2})"|$1 cm
    re:(\d{1,2})"|$1 cm
    $1|<TOPRICE*2,54>{get}</TOPRICE>
    Пробовал и так

    Код:
    re:(\d{1,2}\.\d{1,2})"|<TOPRICE*2,54>$1</TOPRICE> cm
    re:(\d{1,2})"|<TOPRICE*2,54>$1</TOPRICE> cm
    Ничего.... выводит в дюймах не умножает

    Выводит

    10.25 cm front rise. 14.5 cm back rise.
    16.5 cm leg opening. Inseams available: 30 cm, 32 cm, 34 cm.

    Спасибо!
     
    Последнее редактирование модератором: 7 июн 2018
  5. rusalex

    rusalex Active Member Пользователи

    Регистрация:
    22 мар 2018
    Сообщения:
    133
    Город:
    Kiev
    Вопрос снимается! Все супер, работает, если поместить эту конфигурацию

    Код:
    re:(\d{1,2}\.\d{1,2})"|<TOPRICE*2,54>$1</TOPRICE> cm
    re:(\d{1,2})"|<TOPRICE*2,54>$1</TOPRICE> cm
    в дополнительные настройки границ парсинга.

    Все супер!
     
    kagorec нравится это.
  6. Atlas

    Atlas New Member Пользователи

    Регистрация:
    10 мар 2018
    Сообщения:
    59
    Здравствуйте.
    Скажите. пожалуйста, какой регуляркой можно удалить из текста "12 Comments ▼" (вместо 12 любое число)?
    Заранее спасибо!
     
  7. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Код:
    re:\d+\sComments\s\▼|
     
    kagorec, xLime и Atlas нравится это.
  8. Mikasantik

    Mikasantik New Member Пользователи

    Регистрация:
    29 июл 2018
    Сообщения:
    2
    Город:
    Кривой Рог
    Привет, как с помощью регулярки поставить запятые? 180BrunetteVeronica а мне надо 180, Brunette, Veronica
     
  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Код:
    re:([\d]+)([A-Z]{1})([a-z]+)|$1, $2$3
    re:([a-z]+)([A-Z]{1})([a-z]+)|$1, $2$3
    [​IMG]
     
    Mikasantik нравится это.
  10. q457

    q457 New Member Пользователи

    Регистрация:
    25 июл 2015
    Сообщения:
    35
    Как с помощью регулярки вырезать первые три цифры по тексту?
    например в тексте встречается такая конструкция
    : (L) 62.2mm, (W) 17.3mm, (H) X23mm; Czas нужно чтоб получилось 62.2 [CSVCS]17.3 [CSVCS] 23
    или же есть иногда и такая конструкция 230 × 230 × 190/230 нужно чтоб получилося 230[CSVCS] 230 [CSVCS] 190
    Подкажите , гуру, не оставьте мимо начинающего
     
  11. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Для первого варианта
    Код:
    re:[A-Za-zА-Яа-яЁё]|
    re:\(|
    re:\)|
    re:\;|
    re:\s+|
    re:\,|[CSVCS]
    
    [​IMG]

    Для второго
    Код:
    re:\/.*|
    re:\s×\s|[CSVCS]
    
    [​IMG]
     
    kagorec, xLime и q457 нравится это.
  12. q457

    q457 New Member Пользователи

    Регистрация:
    25 июл 2015
    Сообщения:
    35
    Спасибо!
     
  13. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Для первого варианта по короче
    Код:
    re:[A-Za-zА-Яа-яЁё]|
    re:\({sep}\){sep}\;{sep}\s|
    re:\,|[CSVCS]
     
  14. Mikasantik

    Mikasantik New Member Пользователи

    Регистрация:
    29 июл 2018
    Сообщения:
    2
    Город:
    Кривой Рог
    большое спасибо
     
  15. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Альтернативный вариант)
    Код:
    re:[^\d\.\,]+|
    ,|[CSVCS]
     
    inotoxic и xLime нравится это.
  16. Atlas

    Atlas New Member Пользователи

    Регистрация:
    10 мар 2018
    Сообщения:
    59
    Добрый день!
    Подскажите, пожалуйста, регулярку, заменяющую это:
    <figcaption id="1">
    на <figcaption>.
    При этом "figcaption" может меняться, значение id тоже. Нужны чистые теги без всяких id.
    Пробовал re:<{skip}\ id=".*?">|, но тщетно.
    Был бы очень признателен за решение!
     
  17. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    Почему для этого нужна регулярка?
    Код:
    <{skip} {skip}>|<{skip(1)}>
    [​IMG]

    Но если сильно хотите:
    Код:
    re:(<\w+)([^>]+)>|$1>
    [​IMG]
     
    Последнее редактирование: 8 авг 2018
    Atlas нравится это.
  18. Atlas

    Atlas New Member Пользователи

    Регистрация:
    10 мар 2018
    Сообщения:
    59
    <{skip} {skip}>|<{skip{1}}>
    Спасибо! Только куда это вставить? :) Вставил в поиск-замену, и у меня так и выводится <{skip{1}}> вместо тега.
     
  19. xLime

    xLime Well-Known Member Супер Модератор Модератор

    Регистрация:
    4 сен 2017
    Сообщения:
    401
    В любую функцию поиск-замены. Смотрите скрин - все должно работать. Или приложите файл проекта.
     
  20. Atlas

    Atlas New Member Пользователи

    Регистрация:
    10 мар 2018
    Сообщения:
    59
    Регулярка удаляет последнюю букву чистого тега:
    [​IMG]
    Замена через {skip} обрезает предложения:
    [​IMG]
     

Поделиться этой страницей