Парсинг выдачи поисковых сетей и последующий парсинг имэйлов

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Kevin, 28 июн 2020.

  1. Kevin

    Kevin New Member Пользователи

    Регистрация:
    10 июн 2020
    Сообщения:
    17
    Здравствуйте, нужен парсер на базе Content Downloader, который парсит ссылки поисковой выдачи по ключевым словам, а затем парсит имэйлы с этих ссылок.
    Например, спарсили 1000 ссылок по запросу "холодильник", после этого вытаскиваем имэйлы с этих ссылок. И так далее. Парсинг планируется регулярный

    ПС: Яндекс, Гугл, Мэйл ру, Бинг

    На выходе должна получиться таблица со столбцами: Поисковый Запрос — Домен — URL — Почта

    Нужен не разовый результат, а файл проекта.

    Цена - договорная, оплата - банковская карта, по договоренности и другие способы
     
    Последнее редактирование: 28 июн 2020
  2. Фёдор

    Фёдор Active Member Пользователи

    Регистрация:
    9 фев 2014
    Сообщения:
    167
    Здравствуйте. Тут нужен комплекс парсеров. Это серьёзная, амбициозная задача, и стоить её реализация, будет 40 тыс.
     
    kagorec нравится это.
  3. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Тут, скорее, дело не столько в реализации, сколько в хороших проксях.
     
  4. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    предположу, что у вас нет практики создания подобного рода проектов
    прокси - это самое малое...
     
    Фёдор и kagorec нравится это.
  5. Reset

    Reset Active Member Пользователи

    Регистрация:
    16 дек 2013
    Сообщения:
    114
    Есть вариант на основе другой программы, но со старта надо будет выложить около 300$, устроит?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В чем именно проблема сделать это средствами программы? В поиске имейл адреса на сайтах?
     
    gans нравится это.
  7. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Хотя-бы том что, при переходе из поисковой выдачи - не всегда попадаем на страницу с email
     
    kagorec нравится это.
  8. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    Не проблема, можно написать проект который ищет по всему сайту email адреса. Например, если не находит на главной, ищет по страницам "о нас", "контакты" и т.д. Что-то типа такого:
     

    Вложения:

  9. Фёдор

    Фёдор Active Member Пользователи

    Регистрация:
    9 фев 2014
    Сообщения:
    167
    В идеале надо делать так, что бы искал на страницах сайта по приоритетам. То есть сначала на главной, потом на страницах, где потенциально могут быть контакты, потом на страницах с уровнем вложенности определенным, при этом, на определенном этапе, когда емайл найден, поиск на данном сайте должен останавливаться.
     
  10. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    То же самое я и отправил, ищет на главной, потом на страницах контактной информации, можете дописать чтобы искал по остальным страницам. Просто на скорую руку проект накидал.
     
  11. Фёдор

    Фёдор Active Member Пользователи

    Регистрация:
    9 фев 2014
    Сообщения:
    167
    А логика остановки поиска по остальным страницам прописана, в случае, если найден емайл на первых страницах, предазначенных для поиска?
     
  12. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    Если найден email на главной, то остановит, если не найден будет искать на страницах у которых анкор содержит вхождения "контакт","о нас","о компании", можно убрать поиск по вхождениям, но тогда будет дольше искать.
     
    Root нравится это.
  13. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Предположение неверное. Есть опыт создания похожих проектов. Хотя, справедливости ради, при работе использую и другой софт. Тут дело привычки и лени, оно и так работает.
     
  14. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    На практике, будет плохой результат.
     
  15. kenny872012

    kenny872012 Well-Known Member Пользователи

    Регистрация:
    18 фев 2018
    Сообщения:
    313
    На платной основе могу сделать приложение для поиска email по сайтам и результат будет какой вам нужен. Этот скрипт писался минут 5, чтобы показать другим пользователям что можно перейти из cd на станицу с email.
     
    inotoxic нравится это.
  16. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Не нужно забывать про замечательный макрос GETURLSBYANCHORS!
     
    inotoxic нравится это.
  17. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    безусловно - но я ими не пользуюсь ))

    А какие есть варианты обхода ограничений поисковой выдачи на один ключ ?
     
  18. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Зря не пользуетесь GETURLSBYANCHORS! Это прекрасно - выдернуть по анкорам страницы с контактными данными, а потом спарсить, что нужно. Впрочем, каждый делает, как удобно.

    Варианты обхода поисковой выдачи могут быть разные. Зависит от ситуации. Нужно использовать логику. Иногда работает добавить к ключу хоть одну букву алфавита, цифру; иногда: название города и т.д. Также советую погуглить сложные запросы google. И не забывайте, не единым гуглом жив человек! ;)
     
    Последнее редактирование: 29 июн 2020
  19. gans

    gans Well-Known Member Пользователи

    Регистрация:
    21 апр 2014
    Сообщения:
    309
    Тоже - неверно, касаемо обсуждаемой программы. И, дело, не в программе. Она - отличная!

    PS Я не участвую в предложении написания проекта за деньги, а участвую в обсуждении. Просто делюсь опытом. Что-то похожее у меня вполне успешно работает.
     
    Последнее редактирование: 30 июн 2020
  20. Фёдор

    Фёдор Active Member Пользователи

    Регистрация:
    9 фев 2014
    Сообщения:
    167
    Несомненно))
    Тут главное фантазия. Возможностей у неё хватает слихвой!
     

Поделиться этой страницей