Kas ir optiskā rakstzīmju atpazīšana?

Lai gan ir viegli paņemt dokumentu datorā un iegūt fizisku kopiju ar printeri, parasti ir grūtāk izvēlēties citu ceļu. Lai gan pastāv skeneri un tie var saglabāt skenētos dokumentus kā attēlu, tas nav īpaši noderīgi, ja vēlaties rediģēt dokumentu. Lai varētu rediģēt dokumentu, izmantojiet tehnoloģiju, ko sauc par optisko rakstzīmju atpazīšanu vai OCR.

Kā darbojas rakstzīmju optiskā atpazīšana?

OCR izmanto dažādas metodes, lai precīzi nolasītu dokumentus. OCR programmatūra pielāgo dokumentu un, iespējams, pat atsevišķus vārdus, lai tie būtu pareizi līdzināti. Attēls tiek pārveidots tīri melnbaltā formātā, jo tas ir vieglāk, nekā atšķirt pelēkos toņus. Analīze tiek veikta arī, lai identificētu un noņemtu visus neteksta vienumus.

Tiek izmantoti divi galvenie OCR algoritmu veidi: matricas saskaņošana un funkciju iegūšana. Matricas atbilstības noteikšana ņem vienas rakstzīmes attēlu, pēc tam salīdzina to ar algoritmu konfigurētajiem fontiem pa pikseļiem pa pikseļiem. Šis paņēmiens prasa, lai rakstzīme būtu pareizi izolēta no visa pārējā satura un fonts ir jāiekļauj OCR programmatūrā. Šis OCR veids nedarbojas arī rokraksta atpazīšanai.

Iezīmju iegūšanas algoritmi katru rakstzīmi sadala pa elementiem, piemēram, līnijām, līknēm un līniju krustojumiem. Šis paņēmiens ievērojami samazina paļaušanos uz algoritmu, kas tiek apmācīts ar zināmiem fontiem. Funkciju izvilkšana spēj atpazīt un pārrakstīt jaunus fontus, kā arī dažus rokrakstus, lai gan precizitāte nav tik laba kā zināmiem fontiem.

Dažas uzlabotas programmatūras izmanto apkārtējo burtu kontekstu, lai palīdzētu identificēt burtus, kas nav tik skaidri. Piemēram, ja tiek izdrukāts vārds “suns” un OCR algoritms nevar droši noteikt, vai “o” ir “a” vai “o”, tas var izmantot vārdnīcu, lai noskaidrotu, vai ir kāda potenciālo rakstzīmju kombinācija. padara zināmu vārdu. Šajā gadījumā OCR algoritms izslēgtu “a” iespēju, jo “dag” nav vārds, bet “suns” ir.

Kur tiek izmantota OCR?

Viens no galvenajiem OCR lietojumiem ir pasta sistēmā. OCR tiek izmantots, lai automātiski identificētu vēstuļu un paku adreses, un to var paveikt ievērojami ātrāk nekā cilvēki. Gadījumos, kad OCR sistēma nevar nolasīt etiķetes adresi, tā tiks atdalīta, lai cilvēks varētu apstrādāt manuāli.

OCR ir noderīgs kā pieejamības rīks cilvēkiem ar redzes traucējumiem, ja to apvieno ar teksta pārvēršanas runā rīku. Google tulkotājs arī ievieš OCR kā daļu no attēla teksta tulkošanas procesa.


Leave a Comment

Kā pārvērst RAR failu uz ZIP Windows

Kā pārvērst RAR failu uz ZIP Windows

Vai jums ir RAR faili, kurus vēlaties pārvērst ZIP failos? Uzziniet, kā pārvērst RAR failu ZIP formātā.

Kā labot OneDrive kļūdas kodu 0x8004de88

Kā labot OneDrive kļūdas kodu 0x8004de88

Atklājiet, kā labot OneDrive kļūdas kodu 0x8004de88, lai varētu atjaunot savu mākoņu krātuvi.

Spotify: Atspējot Automātisko Palaišanu

Spotify: Atspējot Automātisko Palaišanu

Spotify var būt traucējošs, ja tas automātiski atveras katru reizi, kad jūs sākat datoru. Atspējojiet automātisko palaišanu, izmantojot šos soļus.

Kā iztīrīt kešu Google Chrome

Kā iztīrīt kešu Google Chrome

Saglabājiet kešu iztīrītu savā Google Chrome tīmekļa pārlūkā, sekojot šiem soļiem.

Kā kastēt Microsoft Teams uz TV

Kā kastēt Microsoft Teams uz TV

Microsoft Teams pašlaik neatbalsta jūsu tikšanās un zvanus kastēšanai uz TV dabiski. Bet jūs varat izmantot ekrāna atspoguļošanas lietotni.

3 soļi, kā integrēt ChatGPT Word

3 soļi, kā integrēt ChatGPT Word

Vai domājat, kā integrēt ChatGPT Microsoft Word? Šis ceļvedis parāda, kā to izdarīt ar ChatGPT for Word papildinājumu 3 vienkāršos soļos.

Adobe Reader: Mainīt noklusējuma tālummaiņas iestatījumu

Adobe Reader: Mainīt noklusējuma tālummaiņas iestatījumu

Šajā pamācībā mēs parādām, kā mainīt noklusējuma tālummaiņas iestatījumu Adobe Reader.

Kā mainīt lietotāja aģentu Safari

Kā mainīt lietotāja aģentu Safari

Šeit atradīsit detalizētas instrukcijas, kā mainīt lietotāja aģentu virkni Apple Safari pārlūkprogrammā MacOS.

Risinājums Microsoft Teams: Atvainojiet, mēs nevarējām savienoties

Risinājums Microsoft Teams: Atvainojiet, mēs nevarējām savienoties

Vai bieži redzat paziņojumu "Atvainojiet, mēs nevarējām savienoties" MS Teams? Izmēģiniet šos problēmu novēršanas padomus, lai tagad atbrīvotos no šīs problēmas!

Kā pārveidot rakstītu tekstu par tekstu ar Samsung Notes

Kā pārveidot rakstītu tekstu par tekstu ar Samsung Notes

Ja meklējat atsvaidzinošu alternatīvu tradicionālajai ekrānām, Samsung Galaxy S23 Ultra piedāvā lielisku risinājumu. Ar