🇺🇦 Мы работаем: ПН-ПТ: 09:00-18:00 (Киев) Telegram Viber WhatsApp
Киев / Одесса (Украина):+38-098-887-05-49

OCR процесс получения текста с изображения в WEBЧто такое OCR

OCR (optical character recognition) — это перевод различного типа изображений (рукописного, машинописного, печатного и другого) в текстовое электронное представление, для проведения дальнейшего редактирования, обработки и анализа информации. В простом понятии — это процесс получения текста с изображения.
В программном представление, OCR — это разработанный на том или ином языке программирования алгоритм обработки изображения, который программным путем распознает текстовые символы.
Такие программные продукты используются для оцифровывания книг, газет, журналов, различной текстовой документации, архивной информации и прочее.

OCR и WEB

В рамках WEB системы оптического распознавания текстов могут использоваться для самых различных целей. Как пример, такую систему можно подключить на сайт и с ее помощью обрабатывать товарно-транспортные накладные (в отсканированом варианте) чтобы автоматизировать процесс учета товаров на сайте. Также данный функционал можно использовать в интернет-магазинах для предоставления клиенту ссылки на отслеживания местоположения посылки, если транспортная компания перевозчик предлагает такой функционал. Такие решения можно реализовать путем распознавания необходимых данных с товарно-транспортной накладной компании-перевозчика и формирования для клиента ссылки, перейдя по которой, он сможет увидеть статус и положение отправленного для него груза.

Существующее программное обеспечение

В настоящее время существует достаточно много вариантов программной реализации OCR систем, которые отличаются многими параметрами и особенностями: начиная от алгоритмов, тематики распознаваемого текста, наличием настольной программы, доступностью в режиме онлайн и заканчивая ценой за объем распознаваемой единицы. Но, если рассматривать использование OCR в рамках WEB, то можно выделить несколько сервисов, которые отличаются легкостью использования, качеством предоставляемых услуг и ценовой доступностью.

ABBYY Cloud OCR SDK

Первая из рассматриваемых OCR систем — ABBYY Cloud OCR SDK. Сама компания ABBY, автор данной разработки, славится компьютерной программой ABYY FineReader, которая широко используется в различных сферах, от научно-образовательных до использования в частных компаниях, и до сих пор развивается и поддерживается.
Недавняя разработка ABBYY Cloud OCR SDK, сервиса распознавания текста, дает возможность внедрять в свой сайт данную систему. На официальном сайте предоставляется краткое описание самой системы, тарифы и условия использования, примеры программной реализации, демо-вариант работы их сервиса и прочее.
Само внедрение на сайт не предоставляет особой сложности, так как готовые примеры можно смело вставлять в код и, заполнив необходимые данные безопасности и идентификации, использовать сервис.
ABBYY Cloud OCR SDK отличается широким выбором языков представления результирующего текста (около 198) и качеством перевода.
Если говорить об условиях использования, то изначально бесплатно предоставляется 50 листов распознаваемого текста формата А4. После их использования предлагаются различные пакеты, позволяющие купить расширить лимит до 100 листов за 9,99$, до 1000 листов за 69,99 $, до 5 тыс — 199,99 $, до 30 тыс — 899,99 $ и, если необходимо, свыше 100 тыс листов, то нужно связываться с отделом продаж.
После распознавания изображений, ABBYY Cloud OCR SDK предлагает возможность вывода текста в формате TXT, DOCX, XLSX, PDF, XML, CSV и других. Такой выбор форматов помогает облегчить обработку результирующей информации, получая ее в удобном или необходимом формате.

OCR WEB SERVICE

Следующий сервис предоставляет аналогичный ABBYY Cloud OCR SDK функционал. Отличием является программная реализация, примеры которой предоставляются на программной платформе .NET и языках программирования JAVA и PHP.
Количество доступных языков ограничивается 46.
Качество распознавания текста латинского алфавита на высоком уровне, а вот с кириллицей часто проблемы (когда сервис в результате работы возвращает непонятные символы). О данных проблемах можно прочитать на различных официальных и неофициальных форумах.
Если говорить о ценовых характеристиках, то, для начала, сервис дает месяц бесплатного использования с ограничением в 25 страниц на день. Дальше тарифные планы использования отличаются от времени использования или количества результирующих листов. Так, 1000 страниц распознанного текста стоят 39,95 $.
Результат распознавания можно выводить в популярных форматах, как TXT, DOC, XLS, PDF и других.
Официальный сайт предоставляет всю подробную информацию и условия использования.

Free OCR API

Данный сервис предоставляет простой и недорогой (по сравнению с предыдущими вариантами) функционал. Пример и описание реализации предоставляется на языке PHP. Поддерживается около 70 языков распознаваемого текста.
Результат работы выводиться в виде потока строковых данных, что, для дальнейшей обработки данных, требует понимания и опыта использования языка программирования PHP.
После активации аккаутна использования сервиса, предоставляется возможность бесплатно распознать 200 изображений (страниц). По окончанию этого количества, каждое последующее изображение стоит 0,5 $.

Подведение итогов

Несмотря на сложность самого понятия и реализации OCR, в настоящее время такие системы и сервисы широко распространены и используются в коммерческих и других целях. Развитие и рост популярности рассмотренных сервисов только подтверждает этот факт и предоставляет возможность относительно легко использовать данную технологию при разработке Вашего сайта.

Автор: web-программист агентства стратегического интернет-маркетинга «StarMarketing» Ярослав Кустрич.


Об авторе - Вадим Стеблинский

Русский