Što je optičko prepoznavanje znakova?

Iako je lako uzeti dokument na računalu i dobiti fizičku kopiju pomoću pisača, općenito je teže ići drugim putem. Iako skeneri postoje i mogu spremati skenirane dokumente kao sliku, ovo nije osobito korisno ako želite urediti dokument. Da biste mogli uređivati ​​dokument, želite koristiti tehnologiju koja se zove Optičko prepoznavanje znakova ili OCR.

Kako funkcionira optičko prepoznavanje znakova?

OCR koristi niz tehnika za točno čitanje dokumenata. OCR softver prilagođava dokument, a potencijalno čak i pojedinačne riječi tako da budu ispravno poravnate. Slika se pretvara u čisto crno-bijeli format jer je to lakše nego razlikovati nijanse sive. Analiza se također provodi kako bi se identificirale i uklonile sve stavke koje nisu tekstualne.

Koriste se dvije glavne vrste OCR algoritama, podudaranje matrice i ekstrakcija obilježja. Matrično podudaranje uzima sliku jednog znaka, a zatim je uspoređuje s algoritmima konfiguriranim fontovima na bazi piksel po piksel. Ova tehnika zahtijeva da znak bude ispravno izoliran od svih ostalih sadržaja i da font bude uključen u OCR softver. Ova vrsta OCR-a također ne radi za prepoznavanje rukopisa.

Algoritmi za izdvajanje značajki rastavljaju svaki znak na značajke, kao što su linije, krivulje i križanja linija. Ova tehnika značajno smanjuje oslanjanje na algoritam koji se trenira s poznatim fontovima. Ekstrakcija značajki sposobna je prepoznati nove fontove i prepisati ih, kao i neke rukopise, iako točnost nije tako dobra kao kod poznatih fontova.

Neki napredniji softveri koriste kontekst okolnih slova kako bi lakše identificirali slova koja nisu tako jasna. Na primjer, ako je ispisana riječ "pas" i OCR algoritam ne može sa sigurnošću reći je li "o" "a" ili "o", može koristiti rječnik da vidi postoji li kombinacija potencijalnih znakova čini poznatu riječ. U ovom slučaju, OCR algoritam bi odbacio mogućnost "a", jer "dag" nije riječ, dok "pas" jest.

Gdje se koristi OCR?

Jedna od glavnih upotreba OCR-a je u poštanskom sustavu. OCR se koristi za automatsku identifikaciju adrese pisama i paketa, što je zadatak koji može obaviti znatno brže nego što bi to ljudi mogli. U slučajevima kada OCR sustav ne može pročitati adresu naljepnice, bit će odvojena da bi je čovjek mogao ručno obraditi.

OCR je koristan kao alat za pristupačnost osobama s oštećenjem vida u kombinaciji s alatom za pretvaranje teksta u govor. Google translate također implementira OCR kao dio procesa prevođenja teksta u slikama.


Leave a Comment

3 Koraka za Integraciju ChatGPT-a u Word

3 Koraka za Integraciju ChatGPT-a u Word

Pitate se kako integrirati ChatGPT u Microsoft Word? Ovaj vodič vam pokazuje točno kako to učiniti s dodatkom ChatGPT za Word u 3 jednostavna koraka.

Kako postaviti ponavljajući sastanak u Teams

Kako postaviti ponavljajući sastanak u Teams

Trebate li zakazati ponavljajuće sastanke na MS Teams s istim članovima tima? Saznajte kako postaviti ponavljajući sastanak u Teams.

Teams Live Događaji: Onemogućite anonimna pitanja

Teams Live Događaji: Onemogućite anonimna pitanja

Trenutno nije moguće onemogućiti anonimna pitanja u Microsoft Teams Live Događajima. Čak i registrirani korisnici mogu slati anonimna pitanja.

Adobe Reader: Promjena boje označavanja

Adobe Reader: Promjena boje označavanja

Prikažemo vam kako promijeniti boju označavanja za tekst i tekstualna polja u Adobe Readeru kroz ovu uputu korak po korak.

Onemogućite ekran ažuriranja softvera Apple na Windows 11 i macOS

Onemogućite ekran ažuriranja softvera Apple na Windows 11 i macOS

Želite onemogućiti ekran ažuriranja softvera Apple i sprečiti ga da se prikazuje na vašem Windows 11 PC-u ili Macu? Isprobajte ove metode odmah!

Kako promijeniti korisnički agent u Safariju

Kako promijeniti korisnički agent u Safariju

Ovdje pronađite detaljne upute o tome kako promijeniti niz korisničkog agenta u Appleovom Safariju za MacOS.

Popravite Microsoft Teams: Žao nam je, nismo se mogli povezati s vama

Popravite Microsoft Teams: Žao nam je, nismo se mogli povezati s vama

Vidite li često grešku Žao nam je, nismo se mogli povezati s vama na MS Teams? Pokušajte ove savjete za otklanjanje poteškoća kako biste se riješili ovog problema!

Spotify: Onemogući automatsko pokretanje

Spotify: Onemogući automatsko pokretanje

Spotify može postati dosadan ako se automatski otvara svaki put kada uključite svoje računalo. Onemogućite automatsko pokretanje pomoću ovih koraka.

Kako stvoriti međureferencije u Wordu – Kako to učiniti i zašto

Kako stvoriti međureferencije u Wordu – Kako to učiniti i zašto

Međureferencije mogu učiniti vaš dokument puno korisnijim, organiziranim i dostupnim. Ovaj vodič će vas naučiti kako stvoriti međureferencije u Wordu.

Kako očistiti predmemoriju u Google Chromeu

Kako očistiti predmemoriju u Google Chromeu

Održavajte predmemoriju očišćenom u vašem Google Chrome web pregledniku slijedeći ove korake.