Vaikka asiakirjan ottaminen tietokoneeseen on helppoa ja fyysinen kopio tulostimella, on yleensä vaikeampaa siirtyä toiseen suuntaan. Vaikka skannereita on olemassa ja ne voivat tallentaa skannatut asiakirjat kuvana, tämä ei ole erityisen hyödyllinen, jos haluat muokata asiakirjaa. Jotta voit muokata asiakirjaa, haluat käyttää optista merkintunnistusta tai OCR-tekniikkaa.
Miten optinen merkintunnistus toimii?
OCR käyttää useita tekniikoita asiakirjojen tarkan lukemiseen. OCR-ohjelmisto säätää asiakirjaa ja mahdollisesti jopa yksittäisiä sanoja niin, että ne on kohdistettu oikein. Kuva muunnetaan puhtaasti mustavalkomuotoon, koska se on helpompaa kuin harmaan sävyjen erottaminen toisistaan. Analyysi suoritetaan myös muiden kuin tekstikohteiden tunnistamiseksi ja poistamiseksi.
Käytössä on kahta päätyyppiä OCR-algoritmeja, matriisinsovitus ja piirteiden poimiminen. Matriisivastaavuus ottaa kuvan yhdestä merkistä ja vertaa sitä algoritmien määrittämiin fontteihin pikseli kerrallaan. Tämä tekniikka edellyttää, että merkki on eristetty oikein kaikesta muusta sisällöstä ja että fontti sisällytetään OCR-ohjelmistoon. Tämän tyyppinen OCR ei myöskään toimi käsinkirjoituksen tunnistamiseen.
Ominaisuuden poiminta-algoritmit jakavat jokaisen merkin ominaisuuksiin, kuten viivoihin, käyriin ja viivojen leikkauspisteisiin. Tämä tekniikka vähentää merkittävästi riippuvuutta tunnetuilla fonteilla opetettavasta algoritmista. Ominaisuuksien poimiminen pystyy tunnistamaan uudet kirjasimet ja litteroimaan ne sekä jonkin verran käsialaa, vaikka tarkkuus ei ole yhtä hyvä kuin tunnetuilla kirjasimilla.
Jotkut edistyneemmät ohjelmistot käyttävät ympäröivien kirjainten kontekstia auttaakseen tunnistamaan kirjaimet, jotka eivät ole yhtä selkeitä. Jos esimerkiksi sana "koira" on painettu eikä OCR-algoritmi voi varmuudella sanoa, onko "o" "a" vai "o", se voi käyttää sanakirjaa nähdäkseen, onko mahdollisten merkkien yhdistelmää. tekee tunnetun sanan. Tässä tapauksessa OCR-algoritmi sulkee pois "a":n mahdollisuuden, koska "dag" ei ole sana, kun taas "koira" on.
Missä OCR:ää käytetään?
Yksi OCR:n tärkeimmistä käyttötavoista on postijärjestelmä. Tekstintunnistusta käytetään automaattisesti identifioimaan kirjeiden ja pakettien osoitteet, mikä se voi tehdä huomattavasti nopeammin kuin ihmiset. Jos OCR-järjestelmä ei pysty lukemaan tarran osoitetta, se erotetaan, jotta ihminen voi käsitellä sen manuaalisesti.
Tekstintunnistus on hyödyllinen esteettömyystyökaluna näkövammaisille, kun se yhdistetään tekstistä puheeksi -työkaluun. Google-kääntäjä toteuttaa myös OCR:n osana kuvien tekstin kääntämistä.