Количество повторяющихся границ

Тема в разделе "Границы парсинга", создана пользователем dimanav1981, 20 янв 2017.

  1. dimanav1981

    dimanav1981 New Member Пользователи

    Регистрация:
    20 янв 2017
    Сообщения:
    19
    Здравствуйте, пытаюсь настроить Content Downloader ULTIMATE, но не могу найти макрос для вывода количества отработанных повторяющихся границ. Существует ли он?
    И можно в контенте сайтов искать в тексте слова по морфологическому признаку?
     
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    в повторяющейся границе вставьте макрос [CC] (на английском)
    Искать то можно, но не совсем понятна конечная цель.
    Описывайте реальные примеры пожалуйста!
     
  3. dimanav1981

    dimanav1981 New Member Пользователи

    Регистрация:
    20 янв 2017
    Сообщения:
    19
    Тут он считает их по повторениям 1,2,3,4 а нужно например было выполнено 5 отработок повторяющихся границ и он вывел 5.
     
  4. dimanav1981

    dimanav1981 New Member Пользователи

    Регистрация:
    20 янв 2017
    Сообщения:
    19
    Цель например мне нужно узнать процентное соотношение текста к определенному слову, например машина, я могу посчитать количество слов "машина", но как узнать сколько там слов в склонениях может там есть слова "машине" "машину" и так далее. Сейчас я это делаю просто убрав окончание, но может быть слово "купить", а при парсинге этого слова уже может быть не точность, потому что основа "куп" маленькая.
    И не получается просчитать соотношение через макрос MATH, данные выводит - количество символов в тексте, количество символов в запросе, но при умножение и деление выдает ошибку. Ошибка появляется когда начинаешь использовать макрос MATH.
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Какую именно ошибку выдает макрос [MATH]? Ошибок быть не должно. Опишите, пожалуйста, подробно, чтобы было понятно и приложите файл проекта, в котором возникает ошибка!
     
  6. dimanav1981

    dimanav1981 New Member Пользователи

    Регистрация:
    20 янв 2017
    Сообщения:
    19
    Прикрепил код ошибки. Ошибка возникает при таком расчете [MATH][COUNTUP1(посуда agness производитель[ENTRY])]<CD_GRAN_2!>[/COUNTUP1]*[CHARCOUNT][HTMTOTXT:]посуда agness производитель[/HTMTOTXT][/CHARCOUNT]*100/[CHARCOUNT][HTMTOTXT:]<CD_GRAN_2!>[/HTMTOTXT][/CHARCOUNT][/MATH]
    <CD_GRAN_2!> - это вся страница
    Без макроса MATH показывает 0*27*100/12978
     

    Вложения:

  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Внутрь макроса [MATH] добавили обработчики макросов [HTMTOTXT] и [CHARCOUNT].

    Скачайте и установите доработанную версию программы (в программе: главное меню - файл - центр обновлений -> кнопка "обновить программу/скачать обновленную сборку").

    PS: Пользуйтесь логом выполнения функций в нижней части окна предпросмотра результатов парсинга контента.
     
  8. dimanav1981

    dimanav1981 New Member Пользователи

    Регистрация:
    20 янв 2017
    Сообщения:
    19
    Работает, спасибо. Можно в контенте сайтов искать в тексте слова по морфологическому признаку? И как вывести количества отработанных повторяющихся границ?
     
  9. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Ну если вы напишете миллионы правил и интерпретируете их с помощью тех макросов которые доступны в программе, то наверное и можно. Но как по мне,
    1) нужно смотреть в сторону спец программ (например
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    ) так как это совершенно отдельная область в сфере науки.
    2) возможно больше подойдет получение частотности слов типа вордстата или подобных
     
  10. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Именно такой опции нету.
     
  11. dimanav1981

    dimanav1981 New Member Пользователи

    Регистрация:
    20 янв 2017
    Сообщения:
    19
    Ясно, спасибо большое за помощь.
     
  12. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    Добрый день! У меня вот прям такой же вопрос возник.

    Предположим есть 100 циклов повторок. Фильтрами отфильтровано 70 циклов. Осталось 30 циклов, которые попали в результаты. Как мне вывести это число "30"? Через [CC] не получается.
     
  13. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Замените файл Content Downloader.exe (в папке с программой) этим файлом:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 100 постов.**
    В любое место шаблона повторяющейся границы (shift+ctrl+5) вставляете:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Затем, где нужно, выводите значение с помощью [VARF:name1]
     
    Serheo нравится это.
  14. Serheo

    Serheo Well-Known Member Пользователи

    Регистрация:
    13 окт 2018
    Сообщения:
    251
    Город:
    Москва
    СПАСИБО!!!
     
    Root нравится это.
  15. sokvlad

    sokvlad New Member Пользователи

    Регистрация:
    9 сен 2020
    Сообщения:
    1
    Город:
    Moscow
    Огромное спасибо!
     

Поделиться этой страницей