Co je optické rozpoznávání znaků?

I když je snadné vzít dokument do počítače a získat fyzickou kopii na tiskárně, obecně je těžší jít jinou cestou. I když skenery existují a mohou ukládat naskenované dokumenty jako obrázek, není to příliš užitečné, pokud chcete dokument upravit. Chcete-li dokument upravit, použijte technologii nazývanou optické rozpoznávání znaků nebo OCR.

Jak funguje optické rozpoznávání znaků?

OCR využívá řadu technik k přesnému čtení dokumentů. Software OCR upraví dokument a případně i jednotlivá slova tak, aby byla správně zarovnána. Obraz je převeden do čistě černobílého formátu, protože je to jednodušší než rozlišovat mezi odstíny šedé. Provádí se také analýza k identifikaci a odstranění jakýchkoli netextových položek.

Používají se dva hlavní typy algoritmů OCR, maticové párování a extrakce vlastností. Maticové porovnávání pořídí obrázek jednoho znaku a poté jej porovná s algoritmy nakonfigurovanými fonty pixel po pixelu. Tato technika vyžaduje, aby byl znak správně izolován od veškerého ostatního obsahu a aby bylo písmo zahrnuto do softwaru OCR. Tento typ OCR také nefunguje pro rozpoznávání rukopisu.

Algoritmy extrakce prvků rozdělují každý znak na prvky, jako jsou čáry, křivky a průsečíky čar. Tato technika výrazně snižuje závislost na algoritmu trénovaném se známými fonty. Extrakce funkcí je schopna rozpoznat nová písma a přepsat je, stejně jako určitý rukopis, ačkoli přesnost není tak dobrá jako u známých písem.

Některý pokročilejší software používá kontext okolních písmen, aby pomohl identifikovat písmena, která nejsou tak jasná. Pokud je například vytištěno slovo „pes“ a algoritmus OCR nedokáže s jistotou určit, zda „o“ je „a“ nebo „o“, může pomocí slovníku zjistit, zda existuje nějaká kombinace potenciálních znaků dělá známé slovo. V tomto případě by algoritmus OCR vyloučil možnost „a“, protože „dag“ není slovo, zatímco „pes“ ano.

Kde se používá OCR?

Jedno z hlavních použití OCR je v poštovním systému. OCR se používá k automatické identifikaci adres dopisů a balíků, což je úkol, který zvládne podstatně rychleji než lidé. V případech, kdy systém OCR není schopen přečíst adresu štítku, bude štítek oddělen, aby jej mohl zpracovat ručně.

OCR je užitečný jako nástroj usnadnění pro lidi se zrakovým postižením v kombinaci s nástrojem pro převod textu na řeč. Google Translate také implementuje OCR jako součást procesu překladu textu v obrázcích.


Leave a Comment

24H2 Aktualizace narušuje Auto HDR – Toto je to, co můžete udělat

24H2 Aktualizace narušuje Auto HDR – Toto je to, co můžete udělat

Pro mnoho uživatelů aktualizace 24H2 narušuje auto HDR. Tento průvodce vysvětluje, jak můžete tento problém vyřešit.

Jak přenést Microsoft Teams na TV

Jak přenést Microsoft Teams na TV

Microsoft Teams aktuálně nativně nepodporuje přenos vašich schůzek a hovorů na vaši TV. Můžete však použít aplikaci pro zrcadlení obrazovky.

Adobe Reader: Změna barvy zvýraznění

Adobe Reader: Změna barvy zvýraznění

Ukážeme vám, jak změnit barvu zvýraznění textu a textových polí v Adobe Reader pomocí tohoto krokového tutoriálu.

Jak nastavit opakující se schůzku v Teams

Jak nastavit opakující se schůzku v Teams

Potřebujete naplánovat opakující se schůzky na MS Teams se stejnými členy týmu? Naučte se, jak nastavit opakující se schůzku v Teams.

Jak změnit User Agent v Safari

Jak změnit User Agent v Safari

Zde najdete podrobné pokyny, jak změnit User Agent String v prohlížeči Apple Safari pro MacOS.

Jak opravit chybu OneDrive s kódem 0x8004de88

Jak opravit chybu OneDrive s kódem 0x8004de88

Zjistěte, jak opravit chybu OneDrive s kódem 0x8004de88, abyste mohli znovu spustit své cloudové úložiště.

Jak převést rukopis na text pomocí Samsung Notes

Jak převést rukopis na text pomocí Samsung Notes

Pokud hledáte osvěžující alternativu tradiční klávesnice na obrazovce, Samsung Galaxy S23 Ultra poskytuje vynikající řešení. S

Zakázat obrazovku aktualizace softwaru Apple na Windows 11 a macOS

Zakázat obrazovku aktualizace softwaru Apple na Windows 11 a macOS

Chcete zakázat obrazovku aktualizace softwaru Apple a zabránit jejímu zobrazení na vašem PC s Windows 11 nebo Macu? Vyzkoušejte tyto metody nyní!

Tvorba křížových odkazů ve Wordu – Jak na to a proč

Tvorba křížových odkazů ve Wordu – Jak na to a proč

Křížové odkazy mohou učinit váš dokument mnohem uživatelsky přívětivější, organizovanější a přístupnější. Tento průvodce vás naučí, jak vytvářet křížové odkazy ve Wordu.

LastPass: Došlo k chybě při kontaktování serveru

LastPass: Došlo k chybě při kontaktování serveru

Pokud LastPass nemůže připojit k serverům, vymažte místní cache, aktualizujte správce hesel a zakázat rozšíření v prohlížeči.