Условие по вхождению в DOCSOURCE

Тема в разделе "Обработка данных при парсинге во вкладке "Контент"", создана пользователем ttimbaland, 31 дек 2019.

  1. ttimbaland

    ttimbaland Member Пользователи

    Регистрация:
    8 окт 2014
    Сообщения:
    21
    Добрый день и с наступаюшим 2020 годом всех!
    Помогите плиз с шаблоном вывода по условию, я сдаюсь))

    Требуется из DOCSOURCE найти все вхождения числа/текста "2019" без кавычек и вывести в соседние столбцы CSV все упоминания, где они встретились на данной странице.

    Например,если на всей странице загружаемого дока :

    <div class = "entry">...2019</div> -----> то в ячейку попадает полный текст со вхождением <div class "entry">Как готовиться к 2019 году</div>

    <meta property="og:description" content="...2019" /> -----> то в ячейку попадает полный текст со вхождением <meta property="og:description" content="Топ способов приготовить борщ в 2019 году" />

    и так далее в соседние столбцы...

    Заранее спасибо!
    Всех благ!
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Примерно так в поиск-замена
    Код:
    [FIRST_REPLACE(re:([^<>\/\\"']*)2019([^<>\/\\"']*)|~@$1#2019$2@~{break}#|{break}~@{get}@~|{multiget}[CSVCS]{break}{br2}|)][DOCSOURCE][/FIRST_REPLACE]
    
     
    ttimbaland нравится это.
  3. ttimbaland

    ttimbaland Member Пользователи

    Регистрация:
    8 окт 2014
    Сообщения:
    21
    Спасибо Володь, ща попробую
     
    kagorec нравится это.
  4. ttimbaland

    ttimbaland Member Пользователи

    Регистрация:
    8 окт 2014
    Сообщения:
    21
    Супер все работает, еще раз спасибо!
     
    Root и kagorec нравится это.

Поделиться этой страницей