Эта программа может создать …?

Тема в разделе "Функции и интерфейс программы", создана пользователем bidzhan, 27 ноя 2012.

  1. bidzhan

    bidzhan New Member Пользователи

    Регистрация:
    27 ноя 2012
    Сообщения:
    1
    Мне надо 10000 текстов в 3-4 предложений и в первом предложение обязательно должно быть ключевое слово. Желательно что бы применялись стоп-слова.
    Подробнее:
    Парсер находит строку с ключевым словом, копирует ее и копирует ниже лежащие предложения (без ключевых слов) в заданном количестве. Далее вниз по странице ищет строку с ключевым словом и так же продолжает их копировать.
    Эта программа может это делать? Если да то куплю ее и воспользуюсь предложением помощи.
     
  2. nikolas1612

    nikolas1612 Member Пользователи

    Регистрация:
    27 ноя 2011
    Сообщения:
    439
    Задача сложная, но в принципе реализуема.

    как по мне, выполнение ее средствами одного лишь КД достаточно трудоемко и муторно (хотя и возможно). Придется делать целый конвейер из 2-3 проектов, может больше. можно попытаться решить все вопросы и одним проектом, но он будет сложноват. Я бы порекомендовал Вам использовать КД для парсинга искомых текстов, а для их масштабной обработки использовать функции других приложений, специально заточенных под обработку и сортировку текстовой информации.
     
    Последнее редактирование: 27 ноя 2012
    Root нравится это.
  3. Андрей Николаевич

    Андрей Николаевич New Member Пользователи

    Регистрация:
    9 апр 2012
    Сообщения:
    19
    Достаточно просто это реализовать с помощью "повторяющихся границ"+"фильтрация документов по списку ключевиков"
    Можно и стоп слова учесть.
     

Поделиться этой страницей