Какво е оптично разпознаване на символи?

Въпреки че е лесно да вземете документ на компютъра си и да получите физическо копие с принтер, обикновено е по-трудно да отидете по другия път. Въпреки че съществуват скенери и могат да запазват сканирани документи като изображение, това не е особено полезно, ако искате да редактирате документа. За да можете да редактирате документ, искате да използвате технология, наречена оптично разпознаване на символи или OCR.

Как работи оптичното разпознаване на знаци?

OCR използва редица техники за точно четене на документи. Софтуерът за OCR коригира документа и евентуално дори отделните думи, така че да са подравнени правилно. Изображението се преобразува в чисто черно-бял формат, тъй като това е по-лесно от разграничаването между нюансите на сивото. Анализът също се извършва за идентифициране и премахване на всякакви нетекстови елементи.

Използват се два основни типа OCR алгоритми, съпоставяне на матрица и извличане на характеристики. Матричното съвпадение взема изображение от един знак, след което го сравнява с конфигурираните по алгоритми шрифтове на база пиксел по пиксел. Тази техника изисква символът да бъде правилно изолиран от цялото друго съдържание и шрифтът да бъде включен в софтуера за OCR. Този тип OCR също не работи за разпознаване на почерк.

Алгоритмите за извличане на характеристики разбиват всеки знак на характеристики, като линии, криви и пресечни точки. Тази техника значително намалява зависимостта от алгоритъма, който се обучава с известни шрифтове. Извличането на функции е в състояние да разпознава нови шрифтове и да ги транскрибира, както и някои ръкописни текстове, въпреки че точността не е толкова добра, колкото при познатите шрифтове.

Някои по-усъвършенствани софтуери използват контекста на околните букви, за да помогнат за идентифицирането на букви, които не са толкова ясни. Например, ако думата „куче“ е отпечатана и OCR алгоритъмът не може да каже със сигурност дали „o“ е „a“ или „o“, той може да използва речник, за да види дали има някаква комбинация от потенциални знаци прави известна дума. В този случай алгоритъмът за OCR би отхвърлил възможността за „а“, тъй като „dag“ не е дума, докато „куче“ е.

Къде се използва OCR?

Едно от основните приложения на OCR е в пощенската система. OCR се използва за автоматично идентифициране на адреса на писма и колети, задача, която може да направи значително по-бързо от хората. В случаите, когато OCR системата не може да прочете адреса на етикета, той ще бъде отделен, за да може човек да обработи ръчно.

OCR е полезен като инструмент за достъпност за хора със зрителни увреждания, когато се комбинира с инструмент за преобразуване на текст в говор. Google translate също така прилага OCR като част от процеса на превод на текста в изображения.

Оставете коментар

Как да намерите чернови в приложението Facebook

Как да намерите чернови в приложението Facebook

Ако някога ви прекъснат, докато споделяте мислите си със света, Facebook ви позволява да запазвате публикациите си като чернови – проста малка функция, която се счита за стандартна от приложението...

Защо не мога да активирам „Разширена защита на данните“ на моя iPhone? Обяснени са 4 проверки и 6 решения

Защо не мога да активирам „Разширена защита на данните“ на моя iPhone? Обяснени са 4 проверки и 6 решения

iOS 16.2 е на път да бъде пуснат за обществеността и тази втора актуализация на функциите носи множество нови функции и промени. Сред тези нови функции е възможността за цялостно криптиране на вашия iCl…

Създайте видеоклип с обобщение, използвайки Canva на компютър или мобилно устройство: Ръководство стъпка по стъпка

Създайте видеоклип с обобщение, използвайки Canva на компютър или мобилно устройство: Ръководство стъпка по стъпка

Създайте видеоклип с обобщение, използвайки Canva на компютър или мобилно устройство: Ръководство стъпка по стъпка

Как да намерите нишови миксове в Spotify на компютър или телефон

Как да намерите нишови миксове в Spotify на компютър или телефон

Какво е важно да знаете Niche Mixes на Spotify е набор от персонализирани музикални препоръки, базирани на любимите ви песни, изпълнители, жанрове и индивидуални вкусове. Niche Mixes се съхраняват под ...

Как да намерите какво използва даден файл, използвайки PowerToys от Microsoft

Как да намерите какво използва даден файл, използвайки PowerToys от Microsoft

Какво е важно да знаете Инструментът File Locksmith в PowerToys ви позволява лесно да намерите процесите, които използват даден файл. С File Locksmith можете просто да щракнете с десния бутон върху файл и да изберете „Какво е…“

How to download a page as HTML on iPhone

How to download a page as HTML on iPhone

How to download a page as HTML on iPhone

Как да добавя преходи в Clipchamp

Как да добавя преходи в Clipchamp

Всички видеа, които си струва да се гледат, имат няколко общи неща и добрият преход определено е едно от тях. Без тях видеото ви ще се движи от един кадър към друг като див кон и визуализацията ви...

Как да настроите стрийма си в OBS за първи път [2023]

Как да настроите стрийма си в OBS за първи път [2023]

OBS е най-добрият избор за много създатели на съдържание, когато стриймват на популярни платформи като Twitch, YouTube или Discord. Той ви позволява да създавате различни сцени, да заснемате различни източници и дори...

Windows PowerToys: Как да преименувате файлове и папки групово с помощта на PowerRename

Windows PowerToys: Как да преименувате файлове и папки групово с помощта на PowerRename

Какво е важно да знаете PowerRename е един от инструментите в по-големия набор от помощни програми PowerToys, проектиран специално да ви даде повече опции за преименуване в сравнение с основната функция за преименуване на Windows. С P…

Как да номерирате редове, абзаци и изречения в MS Word [2023]

Как да номерирате редове, абзаци и изречения в MS Word [2023]

Какво е важно да знаете MS Word ви позволява да добавяте номера на редове, което ви позволява бързо да преглеждате различните редове в документа си. Можете също да номерирате абзаци, като използвате списък с номерации и след това да преместите...