Čo je to optické rozpoznávanie znakov?

Aj keď je ľahké vziať dokument do počítača a získať fyzickú kópiu pomocou tlačiarne, vo všeobecnosti je ťažšie ísť opačným smerom. Hoci skenery existujú a dokážu uložiť naskenované dokumenty ako obrázok, nie je to obzvlášť užitočné, ak chcete dokument upraviť. Aby ste mohli upravovať dokument, musíte použiť technológiu nazývanú optické rozpoznávanie znakov alebo OCR.

Ako funguje optické rozpoznávanie znakov?

OCR využíva množstvo techník na presné čítanie dokumentov. Softvér OCR upraví dokument a prípadne aj jednotlivé slová tak, aby boli správne zarovnané. Obraz sa prevedie do čisto čiernobieleho formátu, pretože je to jednoduchšie ako rozlišovanie medzi odtieňmi sivej. Analýza sa vykonáva aj na identifikáciu a odstránenie akýchkoľvek netextových položiek.

Používajú sa dva hlavné typy algoritmov OCR, porovnávanie matíc a extrakcia funkcií. Maticové porovnávanie vytvorí obrázok jedného znaku a potom ho porovná s písmami nakonfigurovanými v algoritmoch na báze pixelov. Táto technika vyžaduje, aby bol znak správne izolovaný od všetkého ostatného obsahu a aby bolo písmo zahrnuté do softvéru OCR. Tento typ OCR tiež nefunguje na rozpoznávanie rukopisu.

Algoritmy extrakcie prvkov rozdeľujú každý znak na prvky, ako sú čiary, krivky a priesečníky čiar. Táto technika výrazne znižuje spoliehanie sa na algoritmus trénovaný so známymi fontami. Extrakcia prvkov dokáže rozpoznať nové fonty a prepísať ich, ako aj určitý rukopis, hoci presnosť nie je taká dobrá ako v prípade známych fontov.

Niektoré pokročilejšie softvéry využívajú kontext okolitých písmen, aby pomohli identifikovať písmená, ktoré nie sú také jasné. Ak je napríklad vytlačené slovo „pes“ a algoritmus OCR nedokáže s istotou zistiť, či „o“ je „a“ alebo „o“, môže použiť slovník, aby zistil, či je nejaká kombinácia potenciálnych znakov robí známe slovo. V tomto prípade by algoritmus OCR vylúčil možnosť „a“, keďže „dag“ nie je slovo, zatiaľ čo „pes“ áno.

Kde sa používa OCR?

Jedno z hlavných použití OCR je v poštovom systéme. OCR sa používa na automatickú identifikáciu adresy listov a balíkov, čo je úloha, ktorú zvládne podstatne rýchlejšie ako ľudia. V prípadoch, keď systém OCR nedokáže prečítať adresu štítku, štítok bude oddelený, aby ho mohol človek spracovať manuálne.

OCR je užitočný ako nástroj dostupnosti pre ľudí so zrakovým postihnutím v kombinácii s nástrojom na prevod textu na reč. Google Translate tiež implementuje OCR ako súčasť procesu prekladu textu v obrázkoch.


Leave a Comment

Ako previesť RAR súbor na ZIP vo Windows

Ako previesť RAR súbor na ZIP vo Windows

Máte nejaké RAR súbory, ktoré chcete previesť na ZIP súbory? Naučte sa, ako previesť RAR súbor na formát ZIP.

Ako vymazať vyrovnávaciu pamäť v prehliadači Google Chrome

Ako vymazať vyrovnávaciu pamäť v prehliadači Google Chrome

Držte vyrovnávaciu pamäť vyčistenú vo vašom webovom prehliadači Google Chrome pomocou týchto krokov.

Adobe Reader: Zmena farby zvýraznenia

Adobe Reader: Zmena farby zvýraznenia

Ukážeme vám, ako zmeniť farbu zvýraznenia textu a textových polí v Adobe Reader s týmto podrobným návodom.

Ako zmeniť User Agent v Safari

Ako zmeniť User Agent v Safari

Nájdite tu podrobné pokyny, ako zmeniť User Agent String vo webovom prehliadači Apple Safari pre MacOS.

Jak prenášať Microsoft Teams na TV

Jak prenášať Microsoft Teams na TV

Microsoft Teams v súčasnosti nepodporuje nativné prenášanie vašich stretnutí a hovorov na TV. Môžete však použiť aplikáciu na zrkadlenie obrazovky.

3 kroky k integrácii ChatGPT do Wordu

3 kroky k integrácii ChatGPT do Wordu

Zaujíma vás, ako integrovať ChatGPT do Microsoft Word? Tento sprievodca vám presne ukáže, ako to urobiť pomocou doplnku ChatGPT pre Word v 3 jednoduchých krokoch.

Ako opraviť blikajúcu obrazovku prehliadača Google Chrome vo Windows

Ako opraviť blikajúcu obrazovku prehliadača Google Chrome vo Windows

Zistite, ako vyriešiť bežný problém, pri ktorom bliká obrazovka v prehliadači Google Chrome.

Ako previesť rukopis na text pomocou Samsung Notes

Ako previesť rukopis na text pomocou Samsung Notes

Hľadáte osviežujúcu alternatívu k tradičnej klávesnici na obrazovke, Galaxy S23 Ultra od Samsungu poskytuje vynikajúce riešenie. S

Vytváranie krížových odkazov v programe Word – Ako to urobiť a prečo

Vytváranie krížových odkazov v programe Word – Ako to urobiť a prečo

Krížové odkazy môžu váš dokument výrazne sprístupniť, usporiadať a uľahčiť jeho používanie. Tento sprievodca vás naučí, ako vytvoriť krížové odkazy v programe Word.

Ako nastaviť opakujúce sa stretnutie v Teams

Ako nastaviť opakujúce sa stretnutie v Teams

Potrebujete naplánovať opakujúce sa stretnutia v MS Teams so svojimi spolupracovníkmi? Naučte sa, ako nastaviť opakujúce sa stretnutie v Teams.