Mi az az optikai karakterfelismerés?

Míg könnyű egy dokumentumot a számítógépére vinni, és egy nyomtatóval fizikai másolatot készíteni, általában nehezebb a másik utat választani. Bár léteznek szkennerek, és képesek a beolvasott dokumentumokat képként menteni, ez nem különösebben hasznos, ha szerkeszteni szeretné a dokumentumot. Egy dokumentum szerkesztéséhez az Optikai karakterfelismerés vagy OCR nevű technológiát kell használni.

Hogyan működik az optikai karakterfelismerés?

Az OCR számos technikát használ a dokumentumok pontos olvasásához. Az OCR-szoftver beállítja a dokumentumot és adott esetben az egyes szavakat is úgy, hogy azok helyesen legyenek igazítva. A kép tiszta fekete-fehér formátumba konvertálódik, mivel ez könnyebb, mint a szürke árnyalatok megkülönböztetése. Elemzést végeznek a nem szöveges elemek azonosítására és eltávolítására is.

Az OCR-algoritmusok két fő típusát használják, a mátrixillesztést és a jellemzők kivonását. A mátrixillesztés egyetlen karakterből álló képet készít, majd pixelenként összehasonlítja az algoritmusok által konfigurált betűtípusokkal. Ez a technika megköveteli, hogy a karaktert megfelelően elkülönítsék az összes többi tartalomtól, és a betűtípust bele kell foglalni az OCR szoftverbe. Ez a fajta OCR szintén nem működik a kézírás felismerésére.

A jellemzők kinyerési algoritmusai az egyes karaktereket jellemzőkre bontják, mint például vonalak, görbék és vonalmetszéspontok. Ez a technika jelentősen csökkenti az ismert betűtípusokkal betanított algoritmustól való függőséget. A funkciókivonás képes az új betűtípusok felismerésére és átírására, valamint néhány kézírásra is, bár a pontosság nem olyan jó, mint az ismert betűtípusok esetében.

Egyes fejlettebb szoftverek a környező betűk kontextusát használják fel a nem olyan egyértelmű betűk azonosítására. Például, ha a „kutya” szó ki van nyomtatva, és az OCR-algoritmus nem tudja biztosan megmondani, hogy az „o” „a” vagy „o”-e, akkor szótár segítségével megvizsgálhatja, hogy a lehetséges karakterek bármilyen kombinációja van-e. ismert szót alkot. Ebben az esetben az OCR algoritmus kizárja az „a” lehetőségét, mivel a „dag” nem szó, míg a „kutya” igen.

Hol használják az OCR-t?

Az OCR egyik fő felhasználási területe a postai rendszer. Az OCR a levelek és csomagok címének automatikus azonosítására szolgál, ez a feladat lényegesen gyorsabban tud elvégezni, mint az emberek. Azokban az esetekben, amikor az OCR-rendszer nem tudja beolvasni a címke címét, a címke leválasztásra kerül, hogy egy ember manuálisan dolgozza fel.

Szövegfelolvasó eszközzel kombinálva az OCR hasznos kisegítő eszköz a látássérült emberek számára. A Google fordító az OCR-t is megvalósítja a képek szövegének fordítási folyamatának részeként.


Leave a Comment

Adobe Reader: A kiemelő szín megváltoztatása

Adobe Reader: A kiemelő szín megváltoztatása

Ez a lépésről lépésre végigvezető útmutató megmutatja, hogyan lehet megváltoztatni a kiemelő színt a szövegek és szöveges mezők számára az Adobe Readerben.

Hogyan lehet megváltoztatni a felhasználói ügynököt a Safari böngészőben

Hogyan lehet megváltoztatni a felhasználói ügynököt a Safari böngészőben

Itt részletes utasításokat talál arról, hogyan lehet megváltoztatni a felhasználói ügynök karakterláncot az Apple Safari böngészőben MacOS rendszeren.

Az Apple Szoftverfrissítés képernyő letiltása Windows 11-en és macOS-en

Az Apple Szoftverfrissítés képernyő letiltása Windows 11-en és macOS-en

Szeretné letiltani az Apple Szoftverfrissítés képernyőt, és megakadályozni, hogy megjelenjen a Windows 11 számítógépén vagy Mac-en? Próbálja ki ezeket a módszereket most!

LastPass: Hiba történt a szerverrel való kapcsolatfelvétel során

LastPass: Hiba történt a szerverrel való kapcsolatfelvétel során

Ha a LastPass nem tud csatlakozni a szervereihez, törölje a helyi gyorsítótárat, frissítse a jelszókezelőt, és tiltsa le a böngésző bővítményeit.

A Google Chrome gyorsítótárának törlése

A Google Chrome gyorsítótárának törlése

Tartsa tisztán a Google Chrome böngésző gyorsítótárát a következő lépésekkel.

24H2 Frissítés Törli az Auto HDR-t – Íme, Mit Tehetsz Ellene

24H2 Frissítés Törli az Auto HDR-t – Íme, Mit Tehetsz Ellene

Sok felhasználó számára a 24H2 frissítés törli az auto HDR-t. Ez az útmutató elmagyarázza, hogyan orvosolhatod ezt a problémát.

Keresztreferenciák létrehozása Wordben – Hogyan csináld és miért

Keresztreferenciák létrehozása Wordben – Hogyan csináld és miért

A keresztreferenciák segíthetnek dokumentumod felhasználóbarátabbá, rendezettebbé és hozzáférhetőbbé tételében. Ez a útmutató megtanítja, hogyan hozhatsz létre keresztreferenciákat Wordben.

Spotify: Az Automatikus Indítás Leállítása

Spotify: Az Automatikus Indítás Leállítása

A Spotify zavaró lehet, ha minden alkalommal automatikusan megnyílik, amikor elindítja a számítógépét. Az automatikus indítás leállítása az alábbi lépések segítségével.

3 lépés a ChatGPT integrálásához a Word-be

3 lépés a ChatGPT integrálásához a Word-be

Kíváncsi arra, hogyan integrálhatja a ChatGPT-t a Microsoft Word-be? Ez az útmutató pontosan megmutatja, hogyan teheti ezt meg a ChatGPT for Word bővítménnyel 3 egyszerű lépésben.

Hogyan javítsuk meg a Google Chrome képernyővillantását Windows rendszeren

Hogyan javítsuk meg a Google Chrome képernyővillantását Windows rendszeren

Tanuld meg, hogyan oldj meg egy gyakori problémát, amelyben a képernyő villog a Google Chrome böngészőben.