Mikä on optinen merkintunnistus?

Vaikka asiakirjan ottaminen tietokoneeseen on helppoa ja fyysinen kopio tulostimella, on yleensä vaikeampaa siirtyä toiseen suuntaan. Vaikka skannereita on olemassa ja ne voivat tallentaa skannatut asiakirjat kuvana, tämä ei ole erityisen hyödyllinen, jos haluat muokata asiakirjaa. Jotta voit muokata asiakirjaa, haluat käyttää optista merkintunnistusta tai OCR-tekniikkaa.

Miten optinen merkintunnistus toimii?

OCR käyttää useita tekniikoita asiakirjojen tarkan lukemiseen. OCR-ohjelmisto säätää asiakirjaa ja mahdollisesti jopa yksittäisiä sanoja niin, että ne on kohdistettu oikein. Kuva muunnetaan puhtaasti mustavalkomuotoon, koska se on helpompaa kuin harmaan sävyjen erottaminen toisistaan. Analyysi suoritetaan myös muiden kuin tekstikohteiden tunnistamiseksi ja poistamiseksi.

Käytössä on kahta päätyyppiä OCR-algoritmeja, matriisinsovitus ja piirteiden poimiminen. Matriisivastaavuus ottaa kuvan yhdestä merkistä ja vertaa sitä algoritmien määrittämiin fontteihin pikseli kerrallaan. Tämä tekniikka edellyttää, että merkki on eristetty oikein kaikesta muusta sisällöstä ja että fontti sisällytetään OCR-ohjelmistoon. Tämän tyyppinen OCR ei myöskään toimi käsinkirjoituksen tunnistamiseen.

Ominaisuuden poiminta-algoritmit jakavat jokaisen merkin ominaisuuksiin, kuten viivoihin, käyriin ja viivojen leikkauspisteisiin. Tämä tekniikka vähentää merkittävästi riippuvuutta tunnetuilla fonteilla opetettavasta algoritmista. Ominaisuuksien poimiminen pystyy tunnistamaan uudet kirjasimet ja litteroimaan ne sekä jonkin verran käsialaa, vaikka tarkkuus ei ole yhtä hyvä kuin tunnetuilla kirjasimilla.

Jotkut edistyneemmät ohjelmistot käyttävät ympäröivien kirjainten kontekstia auttaakseen tunnistamaan kirjaimet, jotka eivät ole yhtä selkeitä. Jos esimerkiksi sana "koira" on painettu eikä OCR-algoritmi voi varmuudella sanoa, onko "o" "a" vai "o", se voi käyttää sanakirjaa nähdäkseen, onko mahdollisten merkkien yhdistelmää. tekee tunnetun sanan. Tässä tapauksessa OCR-algoritmi sulkee pois "a":n mahdollisuuden, koska "dag" ei ole sana, kun taas "koira" on.

Missä OCR:ää käytetään?

Yksi OCR:n tärkeimmistä käyttötavoista on postijärjestelmä. Tekstintunnistusta käytetään automaattisesti identifioimaan kirjeiden ja pakettien osoitteet, mikä se voi tehdä huomattavasti nopeammin kuin ihmiset. Jos OCR-järjestelmä ei pysty lukemaan tarran osoitetta, se erotetaan, jotta ihminen voi käsitellä sen manuaalisesti.

Tekstintunnistus on hyödyllinen esteettömyystyökaluna näkövammaisille, kun se yhdistetään tekstistä puheeksi -työkaluun. Google-kääntäjä toteuttaa myös OCR:n osana kuvien tekstin kääntämistä.


Leave a Comment

Korjaa Microsoft Teams: Anteeksi, emme voineet yhdistää sinua

Korjaa Microsoft Teams: Anteeksi, emme voineet yhdistää sinua

Näetkö usein virheen "Anteeksi, emme voineet yhdistää sinua" MS Teamsissa? Kokeile näitä vianetsintävinkkejä päästäksesi eroon tästä ongelmasta heti!

Kuinka perustaa toistuva kokous Teamsissa

Kuinka perustaa toistuva kokous Teamsissa

Tarvitsetko toistuvien kokousten aikataulutusta MS Teamsissa samoille tiimin jäsenille? Opi, kuinka perustaa toistuva kokous Teamsissa.

Kuinka muuntaa RAR-tiedosto ZIP-muotoon Windowsissa

Kuinka muuntaa RAR-tiedosto ZIP-muotoon Windowsissa

Onko sinulla RAR-tiedostoja, jotka haluat muuntaa ZIP-tiedostoiksi? Opi, kuinka RAR-tiedosto muutetaan ZIP-muotoon.

Kuinka korjata OneDrive-virhekoodi 0x8004de88

Kuinka korjata OneDrive-virhekoodi 0x8004de88

Opi, kuinka korjata OneDrive-virhekoodi 0x8004de88, jotta pilvitallennuksesi toimisi jälleen.

Kuinka heijastaa Microsoft Teamsia televisioon

Kuinka heijastaa Microsoft Teamsia televisioon

Microsoft Teams ei tällä hetkellä tue kokousten ja puheluiden lähettämistä televisioon suoraan. Mutta voit käyttää näyttöpeilausohjelmaa.

Spotify: Poista automaattinen käynnistys

Spotify: Poista automaattinen käynnistys

Spotify voi olla ärsyttävä, jos se avautuu automaattisesti aina, kun käynnistät tietokoneesi. Poista automaattinen käynnistys seuraamalla näitä ohjeita.

3 Vaihetta ChatGPT:n Integroimiseen Wordiin

3 Vaihetta ChatGPT:n Integroimiseen Wordiin

Mietitkö, miten ChatGPT voidaan integroida Microsoft Wordiin? Tämä opas näyttää sinulle tarkalleen, miten se tehdään ChatGPT for Word -lisäosan avulla kolmessa helpossa vaiheessa.

Teams Live Events: Poista Anonyymit Kysymykset

Teams Live Events: Poista Anonyymit Kysymykset

Tällä hetkellä Microsoft Teams Live Events -tilanteissa anonyymiä kysymistä ei voi poistaa käytöstä. Rekisteröityneet käyttäjät voivat jopa lähettää anonyymejä kysymyksiä.

Adobe Reader: Vaihda Oletusarvoinen Zoom-asetus

Adobe Reader: Vaihda Oletusarvoinen Zoom-asetus

Tässä oppaassa näytämme, kuinka voit vaihtaa oletusarvoisen zoom-asetuksen Adobe Readerissa.

Ristik viittausten luominen Wordissä – Kuinka se tehdään ja miksi

Ristik viittausten luominen Wordissä – Kuinka se tehdään ja miksi

Ristik viittaukset voivat tehdä asiakirjastasi paljon käyttäjäystävällisemmän, järjestelmällisemmän ja saavutettavamman. Tämä opas opettaa sinulle, kuinka luoda ristik viittauksia Wordissä.