Чем отличается фильтрация документов "ПОИСК СЛОВ(А)" и "ПОИСК ВХОЖДЕНИЯ"?

Тема в разделе "Разное", создана пользователем seva100, 14 дек 2022.

  1. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Чем отличается фильтрация документов "ПОИСК СЛОВ(А)" и "ПОИСК ВХОЖДЕНИЯ"?
    С ПОИСКОМ СЛОВ(А) все понятно. Если ключевое выражение состоит из одного слова, то тут все понятно. Не рассматриваем. Если ключевое выражение состоит из нескольких слов то тут то ищутся все слова в любой последовательности. Например, ключевое выражение "бел* город*" отберет документы с текстом:
    - красивому белому прибрежному городу
    - на город легла белая простыня
    Режим "ТОЧНОЕ СООТВЕТСТВИЕ" понятен из названия.
    А какой алгоритм у режима "ПОИСК ВХОЖДЕНИЯ"? Предположил, что при ключевой фразе "бел* город*" отберутся документы, текст которых содержит последовательно идущие слова, например "белый город", "белый красивый город". Однако, использовании символа "*" приводит к нулевому результату. Ни чего не отбирается.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Строка:
    Код:
    Слово 1, Слово 2, Слово 3
    Вхождения:
    Код:
    Слово
    Слово 1
    Слово 2
    Слово 2,
    2, С
    Т.е. Под вхождением понимается любая часть строки.
     
  3. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Правильно я понимаю, что режим "ТОЧНОЕ СООТВЕТСТВИЕ" сработает только если искомое значение равно всей строке целиком?
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Да.
     
  5. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Root, спасибо за ответ.
    Т.к. в режиме "ПОИСК ВХОЖДЕНИЯ" нельзя использовать символ подстановки (*), то если надо найти все словоформы словосочетания "белый город" (белому городу, белого города, ...), то единственный выход использовать регулярные выражения?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Ну вот же написано.

    2022-12-14_20-58-07.png

     
  7. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Правда, очень стараюсь, прежде чем задавать вопрос изучить справку, форум и даже провести эксперимент, что бы понять, как оно работает. Но не всегда догоняю.
    Конечно, приведенный Вами пример на скриншоте с методом фильтрации "ПОИСК СЛОВ(А)" и ключевым выражением "Бел* город*" мной изучен, применять пробовал. Но результат не тот. В выдачу попадет текст "на город легла белая простыня", потому что оба слова присутствуют в тексте. Мне же, как писал выше, требуется только текст про "белый город" со всеми его словоформами (белому городу, белого города, ...).
     
    Root нравится это.
  8. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вас понял.

    Тогда регулярка.

    Ссылки недоступны для гостей
     
  9. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Спасибо большое. Разобрались.
     
    Root нравится это.
  10. seva100

    seva100 Member Пользователи

    Регистрация:
    29 мар 2018
    Сообщения:
    38
    Подытожим.
    Фильтрация документов по списку ключевых слов.

    Список ключевых слов (КС):
    • - может указываться прямо в окне "Настройка функции фильтрации документов по списку ключевых слов (shift+ctrl+f)";
    • - может лежать в виде отдельного файла. Тогда в поле ввода списка указывается конструкция: [FILE]Диск:\Путь к файлу\имя файла.расширение[/FILE]
    Методы фильтрации:

    ПОИСК СЛОВ(А)
    Если в строке списка КС указано одно слово, то в проверяемом тексте ищется указанное слово.
    Если в строке списка КС указано несколько слов, то в тексте должны присутствовать все слова в любой последовательности.
    Символом "*" в начале и конце слов можно заменять одну или несколько букв.

    ПОИСК ВХОЖДЕНИЯ
    Если в строке списка КС указано несколько слов, то в некой строке (это важно!) текста должна присутствовать указанная последовательность слов.
    Символ "*" не применяется.

    ТОЧНОЕ СООТВЕТСТВИЕ
    Если в строке списка КС указано несколько слов, то вся некоторая строка (это важно!) текста должна соответствовать указанной последовательности слов.
    Символ "*" не применяется.

    РЕГУЛЯРНОЕ ВЫРАЖЕНИЕ
    Проверяется весь текст на соответствие каждому регулярному выражению, которые построчно указываются в списке КС.
     
    sinoda нравится это.
  11. sinoda

    sinoda New Member Пользователи

    Регистрация:
    10 фев 2012
    Сообщения:
    55
    Город:
    Москва
    не получается правильно отфильтровать ни в одном условии.
    два сохраняемых документа с контентом, один без тега <p>, второй с тегом (он нужен).
    отмечаю "весь документ сохраняемый"
    в поле ключевиков тег <p>
    внизу выбираю "документ будет загружен"
    т.е. если в сохраняемом документе есть <p> - документ будет загружен.
    далее выбираю по очереди варианты совпадения и проверяю фильтрацию через предпросмотр:
    1. поиск слова - оба документа отфильтрованы "фильтр 1", хотя второй док с тегом мог бы остаться (как и задумано)
    2.поиск вхождения - оба документа загрузились, хотя первый мог бы и не загружаться (он не нужен без тега, тег там не найден - мог бы и не загружаться)
    3. точное совпадение - как и в первом случае - отфильтрованы оба "фильтр 1", хотя второй док с тегом мог бы остаться (как и задумано)
    4. регулярное выражение вставил re:\<p\> и просто тег в другом случае - результат как и в п.1 и в п.3 - отфильтрованы оба "фильтр 1", хотя второй док с тегом мог бы остаться (как и задумано)
    вообщем не сохраняет не нужный документ, но и нужный не сохраняет, но если сохраняет нужный, то и не нужный сохраняет :confused:
     
    Последнее редактирование: 13 апр 2023
  12. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    </p> Пробуйте добавить в фильтр закрытый тег

    п.с. Или пришлите в лс проект который некоректно отрабатывает фильтр.
     

Поделиться этой страницей