Парсинг телефонов и e-mail со страниц контактов разных сайтов

Тема в разделе "Решение различных задач по парсингу", создана пользователем infernalrain, 13 апр 2021.

  1. infernalrain

    infernalrain New Member Пользователи

    Регистрация:
    5 янв 2016
    Сообщения:
    21
    Здравствуйте.

    Есть задача собрать e-mail и телефон с сайта.
    На некоторых сайтах, и e-mail и телефон содержатся только на странице "Контакты".

    Идея в следующем: на вход подаются домены (сайты).
    Далее, по вхождению в анкор ссылки слова "контакт" производится поиск такой ссылки.
    Ссылка динамически добавляется в список ссылок для парсинга.

    Найти нужную ссылку по анкору при помощи [GETURLSBYANCHORS] - не проблема.

    Нашел, что динамическое добавление делается макросом [ADDURL] (вот тема). Но никак не пойму, как и где его нужно прописать и как передать в него результат макроса [GETURLSBYANCHORS].

    [ADDURL]{ADDCOUNT}1{/ADDCOUNT}[GETURLSBYANCHORS(контакт[NODUP][NOMAINPAGE])][DOCSOURCE][/GETURLSBYANCHORS][/ADDURL]

    Вот такая конструкция в шаблоне вывода не работает. Или это макрос для WBApp?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Для этого есть специальный макрос шаблона вывода.

    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
     
    infernalrain нравится это.

Поделиться этой страницей