парсинг множества доменов за раз

Тема в разделе "Решение различных задач по парсингу", создана пользователем garat, 1 авг 2017.

  1. garat

    garat New Member Пользователи

    Регистрация:
    23 июл 2017
    Сообщения:
    15
    уважаемые профи подскажите ПЖЛ

    имеется ссылки в txt файлах - но ссылки от разных доменов(10 доменов) и они перемешаны. Конечно можно в екселе отфильтровать и под каждый домен создать проект. НО... Возможно ли настроить программу так, что для каждого домена и ссылки с этого домена были бы свои границы парсинга и свой шаблон вывода? То есть программа бы понимала, что вот эта ссылка отличается доменом - и для нее свой шаблон парсинга и вывода. Задача в дальнейшем постоянно получать контент с этих 10 доменов, один раз все настроив

    если такое можно сделать - то подскажите страничку в вики пжл или в ответе тут - что нужно сделать для этого, в какую сторону копать?
     
    Последнее редактирование: 1 авг 2017
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Попробуйте по [CHECKENTRY] из <CD_DOCURL!> определять домен и выводить нужный набор динамических границ парсинга в зависимости от "сработавшего" домена Ссылки недоступны для гостей

    С уважением к вам, Сергей.
     
    garat нравится это.
  3. garat

    garat New Member Пользователи

    Регистрация:
    23 июл 2017
    Сообщения:
    15
    то что нужно, буду пробовать - спс Сергей
     
    Root нравится это.

Поделиться этой страницей