Как удалить символ скобки в тексте невалидного кода?

Тема в разделе "Решение различных задач по парсингу", создана пользователем jozess, 21 мар 2018.

  1. jozess

    jozess Member Пользователи

    Регистрация:
    19 дек 2010
    Сообщения:
    122
    Сижу ломаю голову:( Попадается невалидный Код документа, с скобкой внутри тегов:

    Код:
    <div class="ar1"> Логическое уравнение 2<5</div>
    <div class="ar2"> Два < четырех</div>
    <div class="ar2"> one<three</div>
    Как удалить(заменить) эти скобки? 2<5 и Два < четырех

    Есть вариант сделать регуляркой типа <(\d+) или вроде <(\[А-я]) но текст может быть разный, и все равно будет попадаться "бракованный материал".
     
    Последнее редактирование: 21 мар 2018
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.433
    Адрес:
    Latvia
    Попробуйте добавить в поиск-замена для этой границы чтоб регулярным выражением заменило на слово
    Код:
    re:>([^<>]+)>([^<>]+)</|>$1 больше $2</
    re:>([^<>]+)<([^<>]+)</|>$1 меньше $2</
     
    Root нравится это.

Поделиться этой страницей