Парсинг картинок- цифр с переводом в буквы

Тема в разделе "Решение различных задач по парсингу", создана пользователем Димитрий, 3 фев 2015.

  1. Димитрий

    Димитрий New Member Пользователи

    Регистрация:
    2 фев 2015
    Сообщения:
    7
    Адрес:
    Московская область
    Город:
    Егорьевск
    здравствуйте!
    а кто-то находил может быть решение парсить страницу с картинками ( часть телефона буквами..а часть графикой).
    чтобы как-то это графику обработать потом и на выходе получить число и залить его соответственно куда следует.
    видимо сайты так делают, противодействуя парсингу..
    вот пример
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    все что после 8-495 сделано картинкой..
     
    Последнее редактирование модератором: 3 фев 2015
  2. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Можно парсить в документ формата html и потом в программу которая разгадывает с картинок цифры скормить весь документ.
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    Вариант с антикаптчей наврятли устроит, поскольку скорость парсинга слишком зависит от сервиса разгадывания.
     
  3. Димитрий

    Димитрий New Member Пользователи

    Регистрация:
    2 фев 2015
    Сообщения:
    7
    Адрес:
    Московская область
    Город:
    Егорьевск
    ну просто я вас про это спрашивал в скайпе, как раз утром сегодня..
    но вопрос то был в том, что надо будет каждую картинку чуть ли не руками обжимать, то есть нажал.. чего-то там сохранил и т.д..
    то есть не автоматически..
     
  4. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Для автоматического распознавания текста с картинок вы можете использовать макрос шаблона вывода [CAPCHA] (Ссылки недоступны для гостей)
    Скрытое содержимое:
    **Скрытое содержимое: доступно при наличии 1 постов.**
    С уважением к вам, Сергей...
     
  5. Димитрий

    Димитрий New Member Пользователи

    Регистрация:
    2 фев 2015
    Сообщения:
    7
    Адрес:
    Московская область
    Город:
    Егорьевск
    спасибо, а может кто-то за умеренное вознаграждение всю эту схему сделать с учетом автоматического распознования картинок?
     
  6. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста.

    Вот контакты ребят, которые занимаются платной настройкой программы Ссылки недоступны для гостей

    С уважением к вам, Сергей...
     
  7. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    При парсинге сохраняется результат в виде документа html - открыв документ видно все телефоны целиком поскольку текстовая часть слево и картиночная справо.
    Далее сохраненный документ остается скормить в программу для разгадывания и в итоге получаете все телефоны полностью текстом, а причем тут обжимание каждой отдельно руками непонятно:laugh:

    Сервис antigate разгадывает не такто быстро 10-60сек., придеться подождать (скорость зависит от цены указаной в панеле пользователя). Но результат оправдает ожидания.
     
  8. Димитрий

    Димитрий New Member Пользователи

    Регистрация:
    2 фев 2015
    Сообщения:
    7
    Адрес:
    Московская область
    Город:
    Егорьевск
    ну так если я сохраненный документ скормлю- я к тому, чтобы не было лишних шагов..
    если тут два шага, то нет проблем.
    шаг один- спарсили сайт.
    шаг два- то что в хтмл- скормили еще кому-то чему-то это два..
    шаг три- имеем готовый CSV. так?
     
  9. kagorec

    kagorec Администратор Команда форума Администратор

    Регистрация:
    3 янв 2011
    Сообщения:
    4.432
    Адрес:
    Latvia
    Правильно.
    Но видимо вам стоит подключить [CAPCHA] и делать все в "шаг один"
     

Поделиться этой страницей