Фильтр строк по ключевым словам.

Тема в разделе "Обработка данных при парсинге во вкладке "Контент"", создана пользователем Rank X, 19 июл 2015.

  1. Rank X

    Rank X New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    28
    Здравствуйте! Помогите пожалуйста советом.
    Настроил повторяющиеся границы, задал обычные границы внутри повторяющейся. Получилось следующее:
    Код:
    <CD_GRAN_13!>[GRAN1][GRAN2][GRAN3][GRAN4][GRAN5]<CD_GRAN_8!><CD_DOCURL!>
    На выходе получаю документ из энного числа строк.
    Каким макросом можно задать некий фильтр из ключевых слов, чтобы итоговый документ содержал только те строки, в которых содержится хотя бы одно из ключевых слов, а строки в которых отсутствуют ключевые слова отфильтровывались бы? В моём случае нужно анализировать [GRAN1]. И где можно подробнее ознакомиться с макросами поддерживаемыми программой?
     
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    CHECKENTRY - Ссылки недоступны для гостей
    MUSTBEINMACRO - выведет с проверкой, если пусто то удалит все что внутри и за макросами WHAT
     
  3. Rank X

    Rank X New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    28
    Вопрос по CHECKENTRY.
    Какую именно конструкцию использовать чтобы: если в тексте содержится одно из трех слов, то документ не выводится?
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.429
    Адрес:
    Latvia
    Вам подойдет другой макрос
    Стрингфилтер имеет параметр delete, и слова указываются через палочку, в итоге стерет весь текст внутри поскольку есть внутри "слово2"
     
    Последнее редактирование: 4 авг 2015
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Вот инструкция Ссылки недоступны для гостей

    С уважением к вам, Сергей.
     
  6. Rank X

    Rank X New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    28
    Здравствуйте!
    Подскажите пожалуйста, какой макрос и с какими параметрами использовать для того, чтобы заменить весь текст в документе на слово Error, если в этом документе встречается хотя бы одно из трех:
    1) Словосочетание You are here
    2) Символ >
    3) Символ »
    Код:
    <CD_GRAN_1!><CD_GRAN_2!><CD_GRAN_3!>
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    С уважением к вам, Сергей.
     
  8. Rank X

    Rank X New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    28
    Здравствуйте!
    Извините, но я затрудняюсь правильно применить эту конструкцию к своему коду. Смущает, что слово текст встречается дважды. В предыдущем примере всё ясно, окружил свой текст макросом, всё работает. А здесь не могу сообразить.
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте еще раз.

    Вы в предыдущем сообщении говорили о тексте. Вот его дважды и вставляйте в макрос вместо слов "текст" в моей конструкции - ничего сложного!

    С уважением к вам, Сергей.
     
  10. Rank X

    Rank X New Member Пользователи

    Регистрация:
    24 апр 2015
    Сообщения:
    28
    Да, работает! Спасибо! Программа замечательная!
    Возможно ли реализовать следующее действие:
    Если в итоговом документе встречается одно из этих трех "слов", то такой документ не выводится, но...
    1) пытается спарситься еще раз.
    2) или ссылка, по которой этот документ парсился, автоматически добавлялась бы в список ссылок находящихся в данный момент в очереди.
     
  11. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    [CHECKENTRY(You are here||>||»)]текст[THENTEXT][RELOADDOCUMENT][ELSETEXT]текст[/CHECKENTRY]
     

Поделиться этой страницей