Стоп-слова в границе парсинга

Тема в разделе "Решение различных задач по парсингу", создана пользователем JohnyLee, 30 июл 2018.

  1. JohnyLee

    JohnyLee Member Пользователи

    Регистрация:
    10 фев 2018
    Сообщения:
    42
    Город:
    Murmans
    Добрый день!

    Есть повторяющаяся граница парсинга <CD_CYCLE_GRAN_1!>. А в ней две обычных границы [GRAN1][CSVCS][GRAN2].
    Так же есть список стоп-слов. Как сделать, чтобы если в первой границе [GRAN1] попадется стоп-слово - её не парсить, а переходить к следующей строчке?

    Нашел похожую функцию "Фильтрация документов по списку ключевиков", но она выбрасывает из парсинга весь документ <CD_CYCLE_GRAN_1!>, а мне нужно выбросить только одну строку [GRAN1][CSVCS][GRAN2].

    Спасибо!
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Ссылки недоступны для гостей - Фильтрация строк по ключевым словам
     
  3. JohnyLee

    JohnyLee Member Пользователи

    Регистрация:
    10 фев 2018
    Сообщения:
    42
    Город:
    Murmans
    Спасибо! В целом все получилось!
    А случайно нет возможности подгружать стоп-слова из csv файла? Подобно тому как это сделано в функции "Фильтрация документов по списку ключевиков"?
    Имею ввиду, как-то так:

    Мне кажется такой функционал логичным, раз оператор [KEYS] предусматривает перечень данных (ключей). Но в справке ответа не нашел. Возможно имеется другой синтаксис? Или его вообще нет?
     
    Последнее редактирование: 30 июл 2018
  4. Neutrion

    Neutrion Member Пользователи

    Регистрация:
    13 ноя 2020
    Сообщения:
    54
    Позвольте узнать в чем разница [STRINGSFILTER][DELETE] и [FILTERSTRINGS]|delete
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вроде ни в чем.
     

Поделиться этой страницей