Как почистить текст от мусора

Тема в разделе "Решение различных задач по парсингу", создана пользователем wcw2007, 22 апр 2019.

  1. wcw2007

    wcw2007 Member Пользователи

    Регистрация:
    15 мар 2017
    Сообщения:
    126
    Добрый день.

    Парсю сразу 6 сайтов в 1 статье, но появляется мусор в виде

    <p> ДЛИНА СТРОКИ МЕНЬШЕ 30 СИМВОЛОВ</p>

    Как удалить такие строки <p> </p> если между <p> </p> 20 символов.

    Проблема что это нужно сделать через поиск и замену!!!

    Спасибо за ответ.
     
  2. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Регулярным выражением

    re:

    но лучше прикладывайте проект парсинга к вопросам.
     

Поделиться этой страницей