Макрос CRAWLER - ограничить число почт

Тема в разделе "Макросы шаблона вывода", создана пользователем NonAgent, 29 мар 2021.

  1. NonAgent

    NonAgent New Member Пользователи

    Регистрация:
    23 мар 2021
    Сообщения:
    6
    Город:
    Пермь
    Здравствуйте. Подскажите пожалуйста, где есть такая функция или что нужно прописать в скрипте, чтобы с сайта, например, доставалось не более 5 почт?

    Пользуюсь макросом Crawler
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Такой функции нет.

    Если приложите файл проекта (с одной ссылкой в списке ссылок), где парсится более 5 почт, постараемся подобрать решение.
     
  3. NonAgent

    NonAgent New Member Пользователи

    Регистрация:
    23 мар 2021
    Сообщения:
    6
    Город:
    Пермь
    Спасибо за предложение помочь!

    Мне преимущественно нужны почты с содержанием "adv", "pr", "reklama", "info". Можно и другие, если таковых не найдётся. Именно поэтому и хотелось бы ограничить выборку, чтобы не тратить ещё пару часов на проверку таблицы из десятков тысяч почт.

    Если поможете, это будет просто супер круто! Весь офис переведу на CD :D
     

    Вложения:

  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Код:
    [CRAWLER]
     
    {STARTURL}SELF{/STARTURL}
     
    {CRAWLDEPTH}2{/CRAWLDEPTH}
    {MAXIMAL_QUERIES}10{/MAXIMAL_QUERIES}
    {QUERIES_PAUSE}1000{/QUERIES_PAUSE}
     
    {TARGET_URL_ANCHORS}Обратная связь|||Реклама|||Рекламодателям|||Написать нам|||Связаться с нами|||Реклама на сайте|||Разместить рекламу|||Сотрудничество|||E-mail|||mailto:|||На сайте{/TARGET_URL_ANCHORS}
    {TARGET_PAGE_TITLES}Обратная связь|||Реклама|||Рекламодателям|||Написать нам|||Связаться с нами|||Реклама на сайте|||Разместить рекламу|||Сотрудничество|||E-mail|||На сайте|||mailto:{/TARGET_PAGE_TITLES}
     
    {FINISH_RULES}{/FINISH_RULES}
     
    {EXTRACTEMAILS_PARAMS}{EE_MAXIMAL}5{/EE_MAXIMAL}{EE_PRIORITY}adv,pr,reklama,info{/EE_PRIORITY}{EE_ALLOW}{/EE_ALLOW}{EE_DISALLOW}{/EE_DISALLOW}{/EXTRACTEMAILS_PARAMS}
    
    {WHAT_TO_FIND}emails{/WHAT_TO_FIND}
     
     
    {ADDITIONAL_PARAMETERS}
    <!--|proceed_start_url|!-->
    <!--|start_from_mainpage|!-->
    add_mainpage
    allow_subdomains
    do_not_add_empty_result
    can_harvest_non_target_pages
    <!--|do_not_filter_start_url_once|!-->
    {/ADDITIONAL_PARAMETERS}
    
    {RESULT_TEMPLATE}{URL}[CSVCS]{ANCHOR}[CSVCS]{TITLE}[CSVCS]{EMAILS}{/RESULT_TEMPLATE}
    {RESULTS_SEPARATOR}[CSVLB]{/RESULTS_SEPARATOR}
     
    [/CRAWLER]
     
  5. NonAgent

    NonAgent New Member Пользователи

    Регистрация:
    23 мар 2021
    Сообщения:
    6
    Город:
    Пермь
    Аааааа! Спасибо Вам! Спасибо!!! Даже и не знаю, как отблагодарить. Вы просто спасли мою семью, а то жена меня ругает постоянно, что после работы, я ещё 2-3 часа работаю, готовясь к завтрашней рассылке..

    Просто нет слов! Вы крутые разработчики!
     
    Root нравится это.

Поделиться этой страницей