Распознавание текста на картинках и сохранение в документ

Тема в разделе "Решение различных задач по парсингу", создана пользователем Djahat, 26 мар 2019.

  1. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Всем привет
    Посоветуйте кто опытный возможное решение, пожалуйста.

    Условия:
    1) на странице сайта есть картинка.
    2) На картинке есть всякий текст (крупный мелкий)

    Задача:
    Взять весь текст с картинки и поместить его в поле в сохраняемый документ.

    Видимо надо эту картинку передать в какой то сервис по распознаванию текста с картинок и получить от него текст.

    Вопрос:
    1) Есть у кого-нибудь на примете информация о сервисе или программа, которая максимально адаптирована под решение задачи через Content Downloader ?
     
  2. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Здравствуйте.

    Тоже интересно.
     
    Djahat нравится это.
  3. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Адекватный, веб-сервис или PHP скрипт по распознаванию картинок, думаю, подключить не проблема.
     
    Djahat нравится это.
  4. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Протестил то что есть в интернетах, без регистрации и с меньшим количеством шагов - мне кажется что это - Ссылки недоступны для гостей

    Как + еще и переводчик

    Ща попробую научится закидывать туда картинку
     
  5. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    А может это и покруче - Ссылки недоступны для гостей
     
  6. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Если, не ошибаюсь - microsoft word c 2016 версии - может распознавать текст на фото вставленное в документ
     
  7. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    у всех будет ограничение на кол-во распознанных документов - потом каптчу начнуть слать или блок вывода формы на страницы
     
  8. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Думаю не просто будет передать туда картинку и забрать оттуда текст, методами CD

    Ну мы еще не решили что это может быть, так что вопрос обхода бана рано подымать наверное
     
  9. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Полазил по интернетам, потестировал кто лучше определяет, похоже это вот яндекс - Ссылки недоступны для гостей

    Сергей, как думаете, как можно попробовать кинуть картинку в этот сервис - ? Ссылки недоступны для гостей
    Чтобы потом распарсить результат ?
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Попробую на днях.
     
    Djahat нравится это.
  11. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Спасибо
    Я пока попробую сам голову поломать
     
  12. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Это именно так ! - будет вам яндекс за спасибо распознавать).

    Вот про лимиты
    Ссылки недоступны для гостей
    Пункт 2,3
     
  13. inotoxic

    inotoxic Well-Known Member Пользователи

    Регистрация:
    13 сен 2015
    Сообщения:
    867
    Каптча - нет ?
     
  14. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Не, по капче ведь есть решение уже, просто картинки со всякими текстами русскими.
    Например как в приложении.
     

    Вложения:

    • 21287_big.jpg
      21287_big.jpg
      Размер файла:
      51,1 КБ
      Просмотров:
      8
  15. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Если с морды ходить, а не через API, при каждом следующем коннекте они не опознают нас, мы же зашифруемся
     
  16. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Бинарные файлы в WEB-сервисы отправляются в multipart/form-data. Это не было предусмотрено в макросе PHP_SCRIPT,попробую ввести.
     
    Djahat нравится это.
  17. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    было бы круто
    Спасибо
     
  18. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пока не за что. Ленился последнее время, постараюсь исправиться.
     
  19. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Ну не знаю как Вы ленились )), но до этого Вы поработали на 5 с плюсом, так что можно и полениться ....
     
  20. Djahat

    Djahat Well-Known Member Пользователи

    Регистрация:
    14 янв 2013
    Сообщения:
    543
    Город:
    Мордор
    Сергей, добрый день.
    Пока нельзя передавать бинарник PHP SCRIPTом ?
     

Поделиться этой страницей