Kas ir optiskā rakstzīmju atpazīšana?

Lai gan ir viegli paņemt dokumentu datorā un iegūt fizisku kopiju ar printeri, parasti ir grūtāk izvēlēties citu ceļu. Lai gan pastāv skeneri un tie var saglabāt skenētos dokumentus kā attēlu, tas nav īpaši noderīgi, ja vēlaties rediģēt dokumentu. Lai varētu rediģēt dokumentu, izmantojiet tehnoloģiju, ko sauc par optisko rakstzīmju atpazīšanu vai OCR.

Kā darbojas rakstzīmju optiskā atpazīšana?

OCR izmanto dažādas metodes, lai precīzi nolasītu dokumentus. OCR programmatūra pielāgo dokumentu un, iespējams, pat atsevišķus vārdus, lai tie būtu pareizi līdzināti. Attēls tiek pārveidots tīri melnbaltā formātā, jo tas ir vieglāk, nekā atšķirt pelēkos toņus. Analīze tiek veikta arī, lai identificētu un noņemtu visus neteksta vienumus.

Tiek izmantoti divi galvenie OCR algoritmu veidi: matricas saskaņošana un funkciju iegūšana. Matricas atbilstības noteikšana ņem vienas rakstzīmes attēlu, pēc tam salīdzina to ar algoritmu konfigurētajiem fontiem pa pikseļiem pa pikseļiem. Šis paņēmiens prasa, lai rakstzīme būtu pareizi izolēta no visa pārējā satura un fonts ir jāiekļauj OCR programmatūrā. Šis OCR veids nedarbojas arī rokraksta atpazīšanai.

Iezīmju iegūšanas algoritmi katru rakstzīmi sadala pa elementiem, piemēram, līnijām, līknēm un līniju krustojumiem. Šis paņēmiens ievērojami samazina paļaušanos uz algoritmu, kas tiek apmācīts ar zināmiem fontiem. Funkciju izvilkšana spēj atpazīt un pārrakstīt jaunus fontus, kā arī dažus rokrakstus, lai gan precizitāte nav tik laba kā zināmiem fontiem.

Dažas uzlabotas programmatūras izmanto apkārtējo burtu kontekstu, lai palīdzētu identificēt burtus, kas nav tik skaidri. Piemēram, ja tiek izdrukāts vārds “suns” un OCR algoritms nevar droši noteikt, vai “o” ir “a” vai “o”, tas var izmantot vārdnīcu, lai noskaidrotu, vai ir kāda potenciālo rakstzīmju kombinācija. padara zināmu vārdu. Šajā gadījumā OCR algoritms izslēgtu “a” iespēju, jo “dag” nav vārds, bet “suns” ir.

Kur tiek izmantota OCR?

Viens no galvenajiem OCR lietojumiem ir pasta sistēmā. OCR tiek izmantots, lai automātiski identificētu vēstuļu un paku adreses, un to var paveikt ievērojami ātrāk nekā cilvēki. Gadījumos, kad OCR sistēma nevar nolasīt etiķetes adresi, tā tiks atdalīta, lai cilvēks varētu apstrādāt manuāli.

OCR ir noderīgs kā pieejamības rīks cilvēkiem ar redzes traucējumiem, ja to apvieno ar teksta pārvēršanas runā rīku. Google tulkotājs arī ievieš OCR kā daļu no attēla teksta tulkošanas procesa.


Leave a Comment

Risinājums Microsoft Teams: Atvainojiet, mēs nevarējām savienoties

Risinājums Microsoft Teams: Atvainojiet, mēs nevarējām savienoties

Vai bieži redzat paziņojumu "Atvainojiet, mēs nevarējām savienoties" MS Teams? Izmēģiniet šos problēmu novēršanas padomus, lai tagad atbrīvotos no šīs problēmas!

Kā pārveidot rakstītu tekstu par tekstu ar Samsung Notes

Kā pārveidot rakstītu tekstu par tekstu ar Samsung Notes

Ja meklējat atsvaidzinošu alternatīvu tradicionālajai ekrānām, Samsung Galaxy S23 Ultra piedāvā lielisku risinājumu. Ar

Kā izveidot atkārtojošu sapulci Teams

Kā izveidot atkārtojošu sapulci Teams

Vai jums ir nepieciešams ieplānot atkārtojošas sapulces MS Teams ar tādiem pašiem komandas locekļiem? Uzziniet, kā izveidot atkārtojošu sapulci Teams.

Krusta atsauču izveide programmā Word – kā to izdarīt un kāpēc

Krusta atsauču izveide programmā Word – kā to izdarīt un kāpēc

Krusta atsauces var padarīt jūsu dokumentu daudz draudzīgāku lietotājiem, organizētāku un pieejamāku. Šis ceļvedis jūs iemācīs izveidot krusta atsauces programmā Word.

24H2 atjauninājums pārtrauc Auto HDR - ko jūs varat darīt šajā gadījumā

24H2 atjauninājums pārtrauc Auto HDR - ko jūs varat darīt šajā gadījumā

Daudziem lietotājiem 24H2 atjauninājums pārtrauc auto HDR. Šis ceļvedis izskaidro, kā jūs varat atrisināt šo problēmu.

Atspējot Apple programmatūras atjaunināšanas ekrānu Windows 11 un macOS

Atspējot Apple programmatūras atjaunināšanas ekrānu Windows 11 un macOS

Vēlies atspējot Apple programmatūras atjaunināšanas ekrānu un novērst tā parādīšanos savā Windows 11 datorā vai Mac? Izmēģini šīs metodes tagad!

Kā novērst Google Chrome ekrāna mirgošanu Windows operētājsistēmā

Kā novērst Google Chrome ekrāna mirgošanu Windows operētājsistēmā

Uzziniet, kā atrisināt biežu problēmu, kad ekrāns mirgo Google Chrome pārlūkā.

Teams Live Events: Atspērt anonīmus jautājumus

Teams Live Events: Atspērt anonīmus jautājumus

Pašlaik nav iespējams atspērto anonīmus jautājumus Microsoft Teams Live Events. Pat reģistrēti lietotāji var nosūtīt anonīmus jautājumus.

Adobe Reader: Maina Teksta Izcelšanas Krāsu

Adobe Reader: Maina Teksta Izcelšanas Krāsu

Mēs parādīsim, kā mainīt teksta un teksta lauku izcelšanas krāsu Adobe Reader, izmantojot šo soli pa solim veidotu pamācību.

LastPass: Radās kļūda, sazinoties ar serveri

LastPass: Radās kļūda, sazinoties ar serveri

Ja LastPass nevar pieslēgties saviem serveriem, iztukšojiet vietējo kešu, atjauniniet paroles pārvaldnieku un atspējojiet pārlūkprogrammas paplašinājumus.