E-mail нет в коде WEB-страницы

Тема в разделе "Решение различных задач по парсингу", создана пользователем kadishev1997, 18 май 2019.

  1. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Здравствуйте!
    Возможно уже был ответ на форуме, но не нашел его.

    Нужно спрасить контакты организации.
    Телефон и ссылка на соц. сеть берется без проблем, а вот email спрятан в javascript (по крайней мере, как это понял я)

    Имеется ли возможность подгружать text/javascript с помощью <GETMORECONTENT> , тем самым чтобы был подгружен элемент кода и в дальнейшем задать границы парсинга для email?

    Знаю, что это легко делается с IE DOM и подобная вещь делается на раз-два, но есть ли реализация не через IE DOM?

    Примеры для сайта:
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей
    Ссылки недоступны для гостей

    Прикрепил фаил проекта для наглядности
     

    Вложения:

    • posleurokov_ru.cdp
      Размер файла:
      58,6 КБ
      Просмотров:
      0
    • posleurokov_ru.cdp
      Размер файла:
      58,6 КБ
      Просмотров:
      0
    • mailto.png
      mailto.png
      Размер файла:
      93,1 КБ
      Просмотров:
      0
    • mailto2.png
      mailto2.png
      Размер файла:
      122,1 КБ
      Просмотров:
      0
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    На этом сайте e-mail не подгружается дополнительным запросом, а генерируется скриптом из закодированных данных.

    Либо пишите скрипт для раскодирования, либо парсите с использованием Internet Explorer. Рекомендую второе.
     
  3. kadishev1997

    kadishev1997 Well-Known Member Пользователи

    Регистрация:
    27 мар 2019
    Сообщения:
    310
    Принял, спасибо за ответ.
     

Поделиться этой страницей