Телефоны с auto.ru

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем Volodka, 25 фев 2015.

  1. Volodka

    Volodka New Member Пользователи

    Регистрация:
    25 фев 2015
    Сообщения:
    1
    Всем, привет!
    Ищу решение по парсингу телефонных номеров с аuto.ru, полистал форум ничего конкретного не нашел, единственное что 2 года назад люди писали "забудте, на авто.ру самая продвинутая защита". Можно ли сегодня с помощью СD реализовать данную потребность? Если да то где можно найти проект и на какое количество номеров я могу рассчитывать (имею ввиду не будет ли авто.ру банить после первой 1000).
    Спасибо! А то не могу определиться покупать или нет...
     
    Последнее редактирование: 25 фев 2015
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Для имитации кликов по кнопке типа "показать номер" требуется версия ULTIMATE (максимальная версия Content Downloader).

    К посту приложил файл проекта программы (cdp -> меню - файл - загрузить проект). И (для имитации действий клика и ввода текста каптч) приложил файл приложения WBApp (wbapp -> ctrl+w - "файл проекта WBApp для парсинга контента" - правее кнопка "указать существующий"). В том же окне (ctrl+w) жмем еще раз ctrl+w и в появившемся инструменте WBApp нажимаем ctrl+e (редактирование списка событий) и прописываем ваш ключ сервиса Antigate вместо ВАШ_КАПТЧА_КЛЮЧ, нажимаем ctrl+enter (для сохранения списка событий) и затем на крестик (справа вверху) закрываем приложение WBApp (настройки сохранятся автоматически при закрытии).

    После этого вернуться в главное окно Content Downloader (вкладка "Контент") и нажать кнопку "начать парсинг (f5)".

    Парсинг проходит в 1 поток и скорость составляет примерно 300 номеров за 1 час.

    Сначала Авто ру выкидывает 1 каптчу через каждые 10 номеров, затем через каждые 3-4.

    Файл с примером парсинга (csv) я тоже приложил.

    Работу с прокси я пока не тестировал, возможно, она даст результат получше, чем работа с вводом каптчи (или вообще не даст результат).

    Если у вас будут еще вопросы, пожалуйста, обращайтесь...

    С уважением к вам, Сергей...
     

    Вложения:

    • auto_ru.cdp
      Размер файла:
      83,8 КБ
      Просмотров:
      82
    • auto_ru.wbapp
      Размер файла:
      666 байт
      Просмотров:
      18
    • article_all_3.zip
      Размер файла:
      5,4 КБ
      Просмотров:
      18
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Запустил еще раз парсинг, спарсило около 300 номеров и забанило по IP:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Если IP динамический, помогает переподключение интернета...

    Думаю, нужно пробовать использовать прокси (постараюсь заняться этим в ближайшее время).

    С уважением к вам, Сергей...
     

Поделиться этой страницей