Парсинг email с сайтов

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Sucelius, 16 фев 2015.

  1. Sucelius

    Sucelius New Member Пользователи

    Регистрация:
    16 фев 2015
    Сообщения:
    1
    Доброго времени суток.
    Вопрос такой: нужно спарсить много много email c разных сайтов.

    1)Берем ссылки на сайты из каталога или поисковика
    2)Лазием по этим ссылкам в поисках email
    3)Выдаем список email

    Прочитал много инфы в "системе помощи" и посмотрел ролики на ютубе

    Но, до сих пор не понял как заставить прогу смотреть на весь сайт..
    понял как найти с 1 страницы emailЫ
    понял как вытащить все ссылки с каталога.
    мб кто поделится ссылочкой которую я не нашел, на эту тему :)
    Буду очень благодарен.
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Сканер сайтов не очень подойдет для сканирования сайтов по их списку (рекомендуются индивидуальные настройки сканера для оптимального поиска ссылок на каждом сайте).

    Хелп по сканеру Ссылки недоступны для гостей

    Мейлы с кода WEB-страниц обычно берутся макросом шаблона вывода [EXTRACTEMAILS]:
    С уважением к вам, Сергей...
     
  3. Ромео

    Ромео New Member Пользователи

    Регистрация:
    22 фев 2015
    Сообщения:
    2
    Как правильно парсить email с поисковой системы?

    Здравствуйте!

    Паршу емейл с разных поисковых систем, в шаблоне вывода стоит: [EXTRACTEMAILS][DOCSOURCE][/EXTRACTEMAILS]

    Указываю страницы с которых парсить так:
    _http://www.bing.com/search?q=запрос+e-mail+%40+.ru+%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D1%8B&sc=0-0&sp=-1&sk=&cvid=2d42f4005eb94ed0b7b369a558e5a897

    Визуально на таких страницах видно сразу 3-7 шт емейлов, но почему то собирается с каждой страницы примерно по 1 емейлу или вообще 0.

    В чём может быть дело? Что я делаю не так? Подскажите пожалуйста.
     
  4. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.431
    Адрес:
    Latvia
    Проверил, странно но есть такое дело. [EXTRACTEMAILS] на февраль 2015-го покачто не мега универсален. Ждемс апдейта.
    Покачто прикладываю рабочий пример, "старый метод" выпарсивания майлов.:soccer:
     

    Вложения:

  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Открыв вашу ссылку вижу там только 1 мейл:
    Макрос поиска мейлов не работает с HTML-тегами. Их нужно удалить (удалить только <strong>):
    Также я ни разу не видел почтовых адресов с кириллицей в них. Поэтому, "липовые" почты типа
    В результат не добавляются!

    Если вы найдете ошибку в работе функции, предоставьте, пожалуйста, код или напишите сюда мейл (конкретный e-mail), который программа "не видит".

    С уважением к вам, Сергей...
     
  6. Ромео

    Ромео New Member Пользователи

    Регистрация:
    22 фев 2015
    Сообщения:
    2
    kagorec, Root, спасибо за помощь!

    Попробовал вариант с удалением тегов и дело пошло, теперь собирается со страницы сразу по много емейлов! :)
     
  7. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста, обращайтесь...
     

Поделиться этой страницей