Стоп-слова в границе парсинга

Тема в разделе "Решение различных задач по парсингу", создана пользователем JohnyLee, 30 июл 2018.

  1. JohnyLee

    JohnyLee Member Пользователи

    Регистрация:
    10 фев 2018
    Сообщения:
    11
    Город:
    Murmans
    Добрый день!

    Есть повторяющаяся граница парсинга <CD_CYCLE_GRAN_1!>. А в ней две обычных границы [GRAN1][CSVCS][GRAN2].
    Так же есть список стоп-слов. Как сделать, чтобы если в первой границе [GRAN1] попадется стоп-слово - её не парсить, а переходить к следующей строчке?

    Нашел похожую функцию "Фильтрация документов по списку ключевиков", но она выбрасывает из парсинга весь документ <CD_CYCLE_GRAN_1!>, а мне нужно выбросить только одну строку [GRAN1][CSVCS][GRAN2].

    Спасибо!
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    3.245
    Ссылки недоступны для гостей, зарегистрируйтесь или авторизуйтесь на форуме! - Фильтрация строк по ключевым словам
     
  3. JohnyLee

    JohnyLee Member Пользователи

    Регистрация:
    10 фев 2018
    Сообщения:
    11
    Город:
    Murmans
    Спасибо! В целом все получилось!
    А случайно нет возможности подгружать стоп-слова из csv файла? Подобно тому как это сделано в функции "Фильтрация документов по списку ключевиков"?
    Имею ввиду, как-то так:

    Мне кажется такой функционал логичным, раз оператор [KEYS] предусматривает перечень данных (ключей). Но в справке ответа не нашел. Возможно имеется другой синтаксис? Или его вообще нет?
     
    Последнее редактирование: 30 июл 2018

Поделиться этой страницей