OCR - Оптичне Розпізнавання Текстів зображень

Зміст:

Що таке OCR

OCR (optical character recognition) — це переклад різного типу зображень (рукописного, машинописного, друкованого та іншого) до текстового електронного подання для проведення подальшого редагування, обробки та аналізу інформації. У простому понятті це процес отримання тексту із зображення.
У програмному уявленні OCR — це розроблений тією чи іншою мовою програмування алгоритм обробки зображення, який програмним шляхом розпізнає текстові символи.
Такі програмні продукти використовуються для оцифровування книг, газет, журналів, різної текстової документації, архівної інформації та інше.

OCR та WEB

У рамках WEB системи оптичного розпізнавання текстів можуть використовуватися для різних цілей. Як приклад, таку систему можна підключити на сайт та за її допомогою обробляти товарно-транспортні накладні (у відсканованому варіанті) щоб автоматизувати процес обліку товарів на сайті. Також цей функціонал можна використовувати в інтернет-магазинах для надання клієнту посилання на відстеження розташування посилки, якщо транспортна компанія перевізник пропонує такий функціонал. Такі рішення можна реалізувати шляхом розпізнавання необхідних даних з товарно-транспортної накладної компанії-перевізника та формування для клієнта посилання, перейшовши за яким, він зможе побачити статус та положення відправленого для нього вантажу.

Існуюче програмне забезпечення

В даний час існує досить багато варіантів програмної реалізації OCR систем, які відрізняються багатьма параметрами та особливостями: починаючи від алгоритмів, тематики тексту, що розпізнається, наявністю настільної програми, доступністю в режимі онлайн і закінчуючи ціною за обсяг розпізнаваної одиниці. Але, якщо розглядати використання OCR у рамках WEB, то можна виділити кілька сервісів, що відрізняються легкістю використання, якістю послуг та ціновою доступністю.

ABBYY Cloud OCR SDK

Перша із розглянутих OCR систем - ABBYY Cloud OCR SDK. Сама компанія ABBY, автор цієї розробки, славиться комп'ютерною програмою ABYY FineReader, яка широко використовується в різних сферах, від науково-освітніх до використання у приватних компаніях, і досі розвивається та підтримується.
Нещодавня технологія ABBYY Cloud OCR SDK, сервісу розпізнавання тексту, дає можливість впроваджувати в свій сайт цю систему. на офіційному сайті надається короткий опис самої системи, тарифи та умови використання, приклади програмної реалізації, демо-варіант роботи їх сервісу та інше.
Саме впровадження на сайт не надає особливої складності, оскільки готові приклади можна сміливо вставляти в код і заповнивши необхідні дані безпеки та ідентифікації використовувати сервіс.
ABBYY Cloud OCR SDK відрізняється широким вибором мов подання результуючого тексту (близько 198) та якістю перекладу.
Якщо говорити про умови використання, то безкоштовно надається 50 аркушів розпізнаваного тексту формату А4. Після їх використання пропонуються різні пакети, що дозволяють купити розширити ліміт до 100 аркушів за 9,99$, до 1000 аркушів за 69,99 $, до 5 тис - 199,99 $, до 30 тис - 899,99 $ 100 тис аркушів, потрібно зв'язуватися з відділом продажів.
Після розпізнавання зображень ABBYY Cloud OCR SDK пропонує можливість виводу тексту у форматі TXT, DOCX, XLSX, PDF, XML, CSV та інших. Такий вибір форматів допомагає полегшити обробку результуючої інформації, отримуючи її у зручному чи необхідному форматі.

OCR WEB SERVICE

Наступний сервіс пропонує аналогічний ABBYY Cloud OCR SDK функціонал. Відмінністю є програмна реалізація, приклади якої надаються на програмній платформі .NET та мовами програмування JAVA та PHP.
Кількість доступних мов обмежується 46.
Якість розпізнавання тексту латинського алфавіту на високому рівні, а от із кирилицею часто проблеми (коли сервіс у результаті роботи повертає незрозумілі символи). Про ці проблеми можна прочитати на різних офіційних та неофіційних форумах.
Якщо говорити про цінові характеристики, то, для початку, сервіс дає місяць безкоштовного використання з обмеженням 25 сторінок на день. Далі тарифні плани використання відрізняються від часу використання чи кількості результуючих листів. Так, 1000 сторінок розпізнаного тексту коштують 39,95 $.
Результат розпізнавання можна виводити у популярних форматах, як TXT, DOC, XLS, PDF та інших.
Офіційний сайт надає всю детальну інформацію та умови використання.

Free OCR API

Даний сервіс надає простий та недорогий (порівняно з попередніми варіантами) функціонал. Приклад та опис реалізації надається мовою PHP. Підтримується близько 70 мов тексту, що розпізнається.
Результат роботи виводиться у вигляді потоку рядкових даних, що для подальшої обробки даних вимагає розуміння та досвіду використання мови програмування PHP.
Після активації аккаутна використання сервісу, надається можливість безкоштовно розпізнати 200 зображень (сторінок). Після закінчення цієї кількості кожне наступне зображення коштує 0,5 $.

Підбиття підсумків

Незважаючи на складність самого поняття та реалізації OCR, нині такі системи та послуги широко поширені та використовуються в комерційних та інших цілях. Розвиток та зростання популярності розглянутих сервісів лише підтверджує цей факт і надає можливість відносно легко використовувати цю технологію під час розробки Вашого сайту.

Автор: web-програміст агентства стратегічного інтернет-маркетингу «StarMarketing» Ярослав Кустрич.

Блог StarMarketing

OCR – оптичне розпізнавання текстів зображень. Аналіз реалізацій у WEB

Що таке OCR

OCR та WEB

Існуюче програмне забезпечення

ABBYY Cloud OCR SDK

OCR WEB SERVICE

Free OCR API

Підбиття підсумків

Про автора - Вадим Стеблінський

Блог StarMarketing

OCR – оптичне розпізнавання текстів зображень. Аналіз реалізацій у WEB

Що таке OCR

OCR та WEB

Існуюче програмне забезпечення

ABBYY Cloud OCR SDK

OCR WEB SERVICE

Free OCR API

Підбиття підсумків

Про автора - Вадим Стеблінський

Схожі повідомлення