Какво е оптично разпознаване на символи?

Какво е оптично разпознаване на символи?

Въпреки че е лесно да вземете документ на компютъра си и да получите физическо копие с принтер, обикновено е по-трудно да отидете по другия път. Въпреки че съществуват скенери и могат да запазват сканирани документи като изображение, това не е особено полезно, ако искате да редактирате документа. За да можете да редактирате документ, искате да използвате технология, наречена оптично разпознаване на символи или OCR.

Как работи оптичното разпознаване на знаци?

OCR използва редица техники за точно четене на документи. Софтуерът за OCR коригира документа и евентуално дори отделните думи, така че да са подравнени правилно. Изображението се преобразува в чисто черно-бял формат, тъй като това е по-лесно от разграничаването между нюансите на сивото. Анализът също се извършва за идентифициране и премахване на всякакви нетекстови елементи.

Използват се два основни типа OCR алгоритми, съпоставяне на матрица и извличане на характеристики. Матричното съвпадение взема изображение от един знак, след което го сравнява с конфигурираните по алгоритми шрифтове на база пиксел по пиксел. Тази техника изисква символът да бъде правилно изолиран от цялото друго съдържание и шрифтът да бъде включен в софтуера за OCR. Този тип OCR също не работи за разпознаване на почерк.

Алгоритмите за извличане на характеристики разбиват всеки знак на характеристики, като линии, криви и пресечни точки. Тази техника значително намалява зависимостта от алгоритъма, който се обучава с известни шрифтове. Извличането на функции е в състояние да разпознава нови шрифтове и да ги транскрибира, както и някои ръкописни текстове, въпреки че точността не е толкова добра, колкото при познатите шрифтове.

Някои по-усъвършенствани софтуери използват контекста на околните букви, за да помогнат за идентифицирането на букви, които не са толкова ясни. Например, ако думата „куче“ е отпечатана и OCR алгоритъмът не може да каже със сигурност дали „o“ е „a“ или „o“, той може да използва речник, за да види дали има някаква комбинация от потенциални знаци прави известна дума. В този случай алгоритъмът за OCR би отхвърлил възможността за „а“, тъй като „dag“ не е дума, докато „куче“ е.

Къде се използва OCR?

Едно от основните приложения на OCR е в пощенската система. OCR се използва за автоматично идентифициране на адреса на писма и колети, задача, която може да направи значително по-бързо от хората. В случаите, когато OCR системата не може да прочете адреса на етикета, той ще бъде отделен, за да може човек да обработи ръчно.

OCR е полезен като инструмент за достъпност за хора със зрителни увреждания, когато се комбинира с инструмент за преобразуване на текст в говор. Google translate също така прилага OCR като част от процеса на превод на текста в изображения.


Поправете Google Meet: Не можете да се присъедините към това видеообаждане

Поправете Google Meet: Не можете да се присъедините към това видеообаждане

Поправете грешки в Google Meet: Не можете да се присъедините към видеообаждане. Актуализирайте браузъра, проверете настройките за дата и час, и опитайте нова връзка.

Minecraft Enchanting: Пълно ръководство

Minecraft Enchanting: Пълно ръководство

Minecraft има задълбочена омагьосваща система, която предоставя конкурентно предимство в битка с омагьосани оръжия и броня.

Топ 5 безплатни софтуер за блокиране на хазарт

Топ 5 безплатни софтуер за блокиране на хазарт

Някои приложения и софтуер срещу хазарт се заплащат. За да ви помогнем, тук са топ 5 безплатни софтуер за блокиране на хазарт.

11 най-добър софтуер за IP камера и средство за преглед на IP камери през 2020 г

11 най-добър софтуер за IP камера и средство за преглед на IP камери през 2020 г

Софтуер за IP камера лесен за използване и удобен. Открийте най-добрия безплатен софтуер за IP камера за вашите камери за видеонаблюдение на Windows, Mac, iPhone или Android.

Google Maps: Как да проверите надморската височина

Google Maps: Как да проверите надморската височина

Научете как да проверите надморската височина в Google Maps. Стъпка по стъпка ръководство за активация на опцията Терен.

15 най-добър софтуер за клониране на диск (безплатен и платен) през 2020 г

15 най-добър софтуер за клониране на диск (безплатен и платен) през 2020 г

Клонирането на диск е важен процес за създаване на копие на твърдия диск. В тази статия споменаваме 15 най-добри, безплатни и платени софтуери за клониране на дискове.

PS5 не се свързва с интернет? 14 начина за коригиране

PS5 не се свързва с интернет? 14 начина за коригиране

Затруднявате ли се да свържете вашата конзола PS5 към конкретна Wi-Fi или Ethernet мрежа? Разберете как да коригирате проблемите със свързването на PS5 с интернет.

Какво е JNLP файл? Как да отворя един?

Какво е JNLP файл? Как да отворя един?

Ако не сте запознати с JNLP файловете, продължете да четете това ръководство, за да научите повече за тях. Ами също да ви покажа как да ги отворите.

Топ 4 начина да получите безплатни TikTok монети

Топ 4 начина да получите безплатни TikTok монети

Вероятно имате любим стриймър в TikTok. Подобно на Twitch, можете да им подарите знак на вашата признателност под формата на TikTok монети.

Как да изтриете популярни търсения в Google

Как да изтриете популярни търсения в Google

Научете как да управлявате популярните търсения в Google и да подобрите личната си продуктивност с нашите лесни за следване инструкции.