Как распознать E-mail с картинки

Тема в разделе "Парсинг конкретных сайтов по запросу (ПЛАТНО)", создана пользователем coolbratan, 9 янв 2015.

  1. coolbratan

    coolbratan New Member Пользователи

    Регистрация:
    27 ноя 2014
    Сообщения:
    52
    Город:
    Харьков
    Здравствуйте, парсю сайт с контактами по вот таким вот ссылочкам:
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    . Мне нужны все контакт-данные с каждой ссылки но проблема, вернее две: телефоны и е-майлы в виде картинки! С телефонами решил вопрос - загружаю через распознавание капчи, хоть и дороговато, но терпимо(240000 контактов). А вот е-майлы antigate упорно распознавать не хочет, причем в мониторе капч вижу, что мыло поступает на сайт, но возвращается ошибка. Думал, думал и нашел только один выход - скачивать картинку и распознавать Finereaderом, да вот только он пишет, что это продлится 20 дней! Есть ли альтернатива? Может я чего-то не увидел, упустил, протупил... Опытные парсеры, посоветуйте, как справиться с задачей?
     

    Вложения:

  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Тут кроме Антигейт вам сейчас ничего посоветовать не могу, уж простите...

    С уважением к вам, Сергей.
     
  3. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.433
    Адрес:
    Latvia
    Распарсить в формат html чтоб отображало картинки тоесть в итоге удобный документ получаете а потом скармливаете в распозновалку текста картинок - ABBYY FineReader
     

Поделиться этой страницей