Що таке оптичне розпізнавання символів?

Що таке оптичне розпізнавання символів?

Хоча легко взяти документ на комп’ютер і отримати фізичну копію за допомогою принтера, зазвичай важче піти іншим шляхом. Хоча сканери існують і можуть зберігати відскановані документи як зображення, це не особливо корисно, якщо ви хочете відредагувати документ. Щоб мати можливість редагувати документ, потрібно використовувати технологію під назвою Optical Character Recognition або OCR.

Як працює оптичне розпізнавання символів?

OCR використовує цілий ряд методів для точного читання документів. Програмне забезпечення OCR коригує документ і, можливо, навіть окремі слова, щоб вони були правильно вирівняні. Зображення перетворюється в чисто чорно-білий формат, оскільки це легше, ніж розрізняти відтінки сірого. Аналіз також виконується для виявлення та видалення будь-яких нетекстових елементів.

Використовуються два основних типи алгоритмів OCR: відповідність матриці та виділення ознак. Матричне відповідність бере зображення одного символу, а потім порівнює його з налаштованими алгоритмами шрифтами на основі пікселя. Ця техніка вимагає, щоб символ був правильно ізольований від усього іншого вмісту та щоб шрифт був включений у програмне забезпечення OCR. Цей тип OCR також не працює для розпізнавання рукописного введення.

Алгоритми виділення ознак розбивають кожен символ на об’єкти, такі як лінії, криві та перетини ліній. Ця техніка значно зменшує залежність від алгоритму, який навчається за допомогою відомих шрифтів. Екстракція функцій здатна розпізнавати нові шрифти та транскрибувати їх, а також деякий почерк, хоча точність не така висока, як для відомих шрифтів.

Деякі більш просунуті програми використовують контекст навколишніх літер, щоб допомогти визначити літери, які не настільки зрозумілі. Наприклад, якщо надруковано слово «собака», а алгоритм OCR не може точно визначити, чи є «o» «a» чи «o», він може використовувати словник, щоб побачити, чи є будь-яка комбінація потенційних символів складає відоме слово. У цьому випадку алгоритм OCR зникне можливість «а», оскільки «dag» не є словом, а «собака» є.

Де використовується OCR?

Одне з основних застосувань OCR – це поштова система. OCR використовується для автоматичного визначення адреси листів і посилок, завдання, яке він може виконувати значно швидше, ніж люди. У випадках, коли система OCR не може прочитати адресу мітки, вона буде відокремлена для обробки вручну людиною.

OCR корисний як інструмент доступності для людей з вадами зору в поєднанні з інструментом перетворення тексту в мовлення. Google translate також реалізує OCR як частину процесу перекладу тексту в зображеннях.


Як вимкнути чат для зустрічі в Zoom

Як вимкнути чат для зустрічі в Zoom

Дізнайтеся, як вимкнути чат у Zoom або обмежити його використання. Ось корисні кроки для зручного використання Zoom.

Як видалити сповіщення Facebook на мобільному телефоні та комп’ютері

Як видалити сповіщення Facebook на мобільному телефоні та комп’ютері

Дізнайтеся, як видалити непотрібні сповіщення Facebook та налаштувати систему сповіщень, щоб отримувати лише важливі повідомлення.

Чому повідомлення Facebook надсилаються, але не доставляються (і як це виправити)

Чому повідомлення Facebook надсилаються, але не доставляються (і як це виправити)

Досліджуємо причини нерегулярної доставки повідомлень на Facebook та пропонуємо рішення, щоб уникнути цієї проблеми.

Як видалити повідомлення Facebook Messenger для обох сторін

Як видалити повідомлення Facebook Messenger для обох сторін

Дізнайтеся, як скасувати та видалити повідомлення у Facebook Messenger на різних пристроях. Включає корисні поради для безпеки та конфіденційності.

Як виправити пошкоджений світ Minecraft або відновити з резервної копії

Як виправити пошкоджений світ Minecraft або відновити з резервної копії

На жаль, пісочниця Minecraft від Mojang відома проблемами з пошкодженими світами. Прочитайте наш посібник, щоб дізнатися, як відновити ваш світ та уникнути втрати прогресу.

Microsoft Teams: як знайти приховані чати

Microsoft Teams: як знайти приховані чати

Щоб знайти приховані чати Microsoft Teams, дотримуйтесь простих порад, щоб повернути їх у видимість і вести ефективну комунікацію.

PS5 не підключається до Інтернету? 14 способів виправити

PS5 не підключається до Інтернету? 14 способів виправити

Вам важко підключити свою консоль PS5 до певної мережі Wi-Fi або Ethernet? Ваша PS5 підключена до мережі, але не має доступу до Інтернету.

Як запланувати повідомлення Slack на потім

Як запланувати повідомлення Slack на потім

Вчасно надсилайте нагадування команді, плануючи свої повідомлення Slack, дотримуючись цих простих кроків на Android і deskrop. Тут ви знайдете корисні поради та кроки щодо планування повідомлень на Slack.

Як за допомогою Telegram надсилати високоякісні фотографії та відео

Як за допомогою Telegram надсилати високоякісні фотографії та відео

Telegram вважається одним із найкращих безкоштовних додатків для обміну повідомленнями з кількох причин, зокрема надсилаючи високоякісні фотографії та відео без стиснення.

Виправлено: Google Meet не може побачити презентацію

Виправлено: Google Meet не може побачити презентацію

Дізнайтеся, як вирішити проблему, коли Google Meet не показує вашу презентацію. Огляд причин та способів усунення несправностей.