Какво е оптично разпознаване на символи?

Въпреки че е лесно да вземете документ на компютъра си и да получите физическо копие с принтер, обикновено е по-трудно да отидете по другия път. Въпреки че съществуват скенери и могат да запазват сканирани документи като изображение, това не е особено полезно, ако искате да редактирате документа. За да можете да редактирате документ, искате да използвате технология, наречена оптично разпознаване на символи или OCR.

Как работи оптичното разпознаване на знаци?

OCR използва редица техники за точно четене на документи. Софтуерът за OCR коригира документа и евентуално дори отделните думи, така че да са подравнени правилно. Изображението се преобразува в чисто черно-бял формат, тъй като това е по-лесно от разграничаването между нюансите на сивото. Анализът също се извършва за идентифициране и премахване на всякакви нетекстови елементи.

Използват се два основни типа OCR алгоритми, съпоставяне на матрица и извличане на характеристики. Матричното съвпадение взема изображение от един знак, след което го сравнява с конфигурираните по алгоритми шрифтове на база пиксел по пиксел. Тази техника изисква символът да бъде правилно изолиран от цялото друго съдържание и шрифтът да бъде включен в софтуера за OCR. Този тип OCR също не работи за разпознаване на почерк.

Алгоритмите за извличане на характеристики разбиват всеки знак на характеристики, като линии, криви и пресечни точки. Тази техника значително намалява зависимостта от алгоритъма, който се обучава с известни шрифтове. Извличането на функции е в състояние да разпознава нови шрифтове и да ги транскрибира, както и някои ръкописни текстове, въпреки че точността не е толкова добра, колкото при познатите шрифтове.

Някои по-усъвършенствани софтуери използват контекста на околните букви, за да помогнат за идентифицирането на букви, които не са толкова ясни. Например, ако думата „куче“ е отпечатана и OCR алгоритъмът не може да каже със сигурност дали „o“ е „a“ или „o“, той може да използва речник, за да види дали има някаква комбинация от потенциални знаци прави известна дума. В този случай алгоритъмът за OCR би отхвърлил възможността за „а“, тъй като „dag“ не е дума, докато „куче“ е.

Къде се използва OCR?

Едно от основните приложения на OCR е в пощенската система. OCR се използва за автоматично идентифициране на адреса на писма и колети, задача, която може да направи значително по-бързо от хората. В случаите, когато OCR системата не може да прочете адреса на етикета, той ще бъде отделен, за да може човек да обработи ръчно.

OCR е полезен като инструмент за достъпност за хора със зрителни увреждания, когато се комбинира с инструмент за преобразуване на текст в говор. Google translate също така прилага OCR като част от процеса на превод на текста в изображения.


Leave a Comment

Как да поправите кода за грешка на OneDrive 0x8004de88

Как да поправите кода за грешка на OneDrive 0x8004de88

Научете как да поправите кода за грешка на OneDrive 0x8004de88, за да можете отново да използвате вашето облачно хранилище.

Как да промените User Agent в Safari

Как да промените User Agent в Safari

Намерете тук подробни инструкции за промяна на User Agent String в браузъра Apple Safari за MacOS.

Поправете Microsoft Teams: Съжаляваме, не можахме да се свържем с вас

Поправете Microsoft Teams: Съжаляваме, не можахме да се свържем с вас

Често ли получавате грешката „Съжаляваме, не можахме да се свържем с вас“ в MS Teams? Опитайте тези съвети за отстраняване на проблеми, за да се отървете от този проблем сега!

Събития на живо в Teams: Деактивиране на анонимни въпроси

Събития на живо в Teams: Деактивиране на анонимни въпроси

В момента не е възможно да се деактивират анонимни въпроси в събитията на живо в Microsoft Teams. Дори регистрираните потребители могат да задават анонимни въпроси.

LastPass: Възникна грешка при свързването със сървъра

LastPass: Възникна грешка при свързването със сървъра

Ако LastPass не успее да се свърже с своите сървъри, изчистете локалния кеш, актуализирайте мениджъра на пароли и деактивирайте разширенията на браузъра си.

Spotify: Деактивиране на автоматичното стартиране

Spotify: Деактивиране на автоматичното стартиране

Spotify може да бъде досадно, ако се отваря автоматично всеки път, когато стартирате компютъра си. Деактивирайте автоматичното стартиране, като следвате тези стъпки.

24H2 актуализация прекратява автоматичния HDR – ето какво можете да направите по въпроса

24H2 актуализация прекратява автоматичния HDR – ето какво можете да направите по въпроса

За много потребители, актуализацията 24H2 прекратява автоматичния HDR. Тази ръководство обяснява как можете да решите този проблем.

Как да настроите повтаряща се среща в Teams

Как да настроите повтаряща се среща в Teams

Трябва ли да планирате повтарящи се срещи в MS Teams с едни и същи участници? Научете как да настроите повтаряща се среща в Teams.

Adobe Reader: Промяна на цвета на маркирането

Adobe Reader: Промяна на цвета на маркирането

Ние ви показваме как да промените цвета на маркирането за текст и текстови полета в Adobe Reader с това ръководство стъпка по стъпка.

3 Стъпки за интегриране на ChatGPT в Word

3 Стъпки за интегриране на ChatGPT в Word

Чудите се как да интегрирате ChatGPT в Microsoft Word? Това ръководство показва точно как да го направите с добавката ChatGPT за Word в 3 лесни стъпки.