Парсинг URL адресов из кода WEB документа

Тема в разделе "Решение различных задач по парсингу", создана пользователем Grushe, 10 сен 2020.

Метки:
  1. Grushe

    Grushe Member Пользователи

    Регистрация:
    10 апр 2014
    Сообщения:
    45
    Нужно из текста забирать все адреса (домены), нужен аналог EXTRACTEMAILS и EXTRACTPHONES только для сайтов. Или это только регулярным выражением?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Попробуйте макрос шаблона вывода [EXTURLS] (вывод всех исходящих ссылок из кода загружаемого web-документа (ссылки с nofollow не учитываются)).

    Можете написать, с каких WEB страниц и какие ссылки нужно парсить.
     

Поделиться этой страницей