Kas yra optinis simbolių atpažinimas?

Nors paprasta paimti dokumentą kompiuteryje ir gauti fizinę kopiją naudojant spausdintuvą, paprastai sunkiau eiti kitu keliu. Nors skeneriai egzistuoja ir gali išsaugoti nuskaitytus dokumentus kaip vaizdą, tai nėra ypač naudinga, jei norite redaguoti dokumentą. Kad galėtumėte redaguoti dokumentą, naudokite technologiją, vadinamą optiniu simbolių atpažinimu arba OCR.

Kaip veikia optinis simbolių atpažinimas?

OCR naudoja įvairius metodus, kad tiksliai nuskaitytų dokumentus. OCR programinė įranga pakoreguoja dokumentą ir galbūt net atskirus žodžius, kad jie būtų tinkamai sulygiuoti. Vaizdas konvertuojamas į grynai nespalvotą formatą, nes tai lengviau nei atskirti pilkus atspalvius. Analizė taip pat atliekama siekiant nustatyti ir pašalinti visus netekstinius elementus.

Naudojami du pagrindiniai OCR algoritmų tipai: matricos suderinimas ir funkcijų ištraukimas. Matricos atitikimas paima vieno simbolio vaizdą, tada palygina jį su algoritmų sukonfigūruotais šriftais pagal pikselį po pikselio. Ši technika reikalauja, kad simbolis būtų tinkamai atskirtas nuo viso kito turinio ir kad šriftas būtų įtrauktas į OCR programinę įrangą. Šio tipo OCR taip pat neveikia atpažįstant rašyseną.

Funkcijų ištraukimo algoritmai suskirsto kiekvieną simbolį į ypatybes, tokias kaip linijos, kreivės ir linijų sankirtos. Ši technika žymiai sumažina priklausomybę nuo algoritmo, kuris mokomas naudojant žinomus šriftus. Funkcijų ištraukimas gali atpažinti naujus šriftus ir juos perrašyti, taip pat kai kuriuos rašysenos būdus, nors tikslumas nėra toks geras kaip žinomų šriftų.

Kai kuri pažangesnė programinė įranga naudoja aplinkinių raidžių kontekstą, kad padėtų atpažinti raides, kurios nėra tokios aiškios. Pavyzdžiui, jei išspausdintas žodis „šuo“, o OCR algoritmas negali tiksliai nustatyti, ar „o“ yra „a“ ar „o“, jis gali naudoti žodyną, kad pamatytų, ar nėra galimų simbolių derinio. daro žinomą žodį. Tokiu atveju OCR algoritmas pašalintų „a“ galimybę, nes „dag“ nėra žodis, o „šuo“ yra.

Kur naudojamas OCR?

Vienas iš pagrindinių OCR naudojimo būdų yra pašto sistemoje. OCR naudojamas automatiškai identifikuoti laiškų ir siuntinių adresus, o tai gali atlikti daug greičiau nei žmonės. Tais atvejais, kai OCR sistema negali nuskaityti etiketės adreso, ji bus atskirta, kad žmogus galėtų apdoroti rankiniu būdu.

OCR yra naudingas kaip pritaikymo neįgaliesiems įrankis žmonėms su regėjimo negalia, kai jis derinamas su teksto į kalbą įrankiu. „Google“ vertėjas taip pat įgyvendina OCR kaip teksto vaizdų vertimo proceso dalį.


Leave a Comment

Kaip sukurti kryžminius nuorodas „Word“ – kaip tai padaryti ir kodėl

Kaip sukurti kryžminius nuorodas „Word“ – kaip tai padaryti ir kodėl

Kryžminės nuorodos gali padaryti jūsų dokumentą daug patogesnį naudoti, gerai organizuotą ir prieinamą. Šiame gide sužinosite, kaip sukurti kryžmines nuorodas „Word“.

3 Žingsniai, kaip integruoti ChatGPT į Word

3 Žingsniai, kaip integruoti ChatGPT į Word

Norite sužinoti, kaip integruoti ChatGPT į Microsoft Word? Šiame gide parodoma, kaip tai padaryti naudojant ChatGPT for Word priedą, per 3 paprastus žingsnius.

Kaip nustatyti periodinį susitikimą Teams

Kaip nustatyti periodinį susitikimą Teams

Ar jums reikia suplanuoti periodinius susitikimus MS Teams su tais pačiais komandos nariais? Sužinokite, kaip nustatyti periodinį susitikimą Teams.

Kaip išvalyti talpyklą „Google Chrome“ naršyklėje

Kaip išvalyti talpyklą „Google Chrome“ naršyklėje

Laikykite talpyklą išvalytą savo „Google Chrome“ naršyklėje naudojant šiuos žingsnius.

Spotify: Išjunkite automatinį paleidimą

Spotify: Išjunkite automatinį paleidimą

Spotify gali būti erzinantis, jei jis automatiškai atsiveria kiekvieną kartą, kai paleidžiate savo kompiuterį. Išjunkite automatinius paleidimus naudodami šiuos žingsnius.

Microsoft Teams problemas sprendimas: Atsiprašome, negalėjome jūsų prijungti

Microsoft Teams problemas sprendimas: Atsiprašome, negalėjome jūsų prijungti

Ar nuolat matote „Atsiprašome, negalėjome jūsų prijungti“ klaidą MS Teams? Išbandykite šiuos trikčių šalinimo patarimus, kad atsikratytumėte šios problemos dabar!

Teams Live Events: Išjungti anonimines klausimas

Teams Live Events: Išjungti anonimines klausimas

Šiuo metu Microsoft Teams Live Events neleidžia išjungti anoniminių klausimų. Net ir registruoti vartotojai gali siųsti anoniminius klausimus.

Kaip pakeisti vartotojo agentą Safari naršyklėje

Kaip pakeisti vartotojo agentą Safari naršyklėje

Čia rasite išsamius nurodymus, kaip pakeisti vartotojo agento eilutę Apple Safari naršyklėje „MacOS“.

Kaip ištaisyti OneDrive klaidos kodą 0x8004de88

Kaip ištaisyti OneDrive klaidos kodą 0x8004de88

Sužinokite, kaip ištaisyti OneDrive klaidos kodą 0x8004de88, kad galėtumėte vėl naudotis savo debesų saugykla.

Kaip konvertuoti RAR failą į ZIP sistemoje Windows

Kaip konvertuoti RAR failą į ZIP sistemoje Windows

Ar turite RAR failų, kuriuos norite konvertuoti į ZIP failus? Sužinokite, kaip konvertuoti RAR failą į ZIP formatą.