Парсинг определенной информации с сайтов (ИНН, ОГРН)

Тема в разделе "Решение различных задач по парсингу", создана пользователем azarial, 18 авг 2014.

  1. azarial

    azarial New Member Пользователи

    Регистрация:
    18 авг 2014
    Сообщения:
    2
    День добрый, программой начал пользоваться относительно недавно. Встала следующая задача: Есть пул ссылок на сайты и нужно проверить, на каких из них есть информация о ЮЛ (если есть, то спарсить), а на каких нет. Подскажите, пжл, хотя бы в каком направлении думать.. Заранее спасибо!
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте!

    Посмотрите функции фильтрации документов по списку ключевиков (shift+ctrl+r)

    Также есть макрос [CHECKENTRY] (Ссылки недоступны для гостей)

    С уважением к вам, Сергей.
     
  3. azarial

    azarial New Member Пользователи

    Регистрация:
    18 авг 2014
    Сообщения:
    2
    Да, увидел функцию, будет очень полезно! спасибо! Теперь нужно понять как подать список сайтов и сгенерировать для них ссылки. Не нашел в мануале как без "границ" анализировать, тем более пачку сайтов..

    Очень буду благодарен!
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Вы про какую пачку говорите???
    1 сайт = 1 настройка
    Как получать ссылки смотреть тут Ссылки недоступны для гостей раздел Парсинг и добавление ссылок
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Вставьте в макрос [CHECKENTRY] макрос [DOCSOURCE] (макрос [DOCSOURCE] выводит HTML-код WEB-документа, который парсите).

    С уважением к вам, Сергей.
     

Поделиться этой страницей