Vad är optisk teckenigenkänning?

Även om det är lätt att ta ett dokument på din dator och få en fysisk kopia med en skrivare, är det generellt sett svårare att gå åt andra hållet. Även om skannrar finns och kan spara skannade dokument som en bild, är detta inte särskilt användbart om du vill redigera dokumentet. För att kunna redigera ett dokument vill du använda en teknik som kallas Optical Character Recognition eller OCR.

Hur fungerar optisk teckenigenkänning?

OCR använder en rad olika tekniker för att korrekt läsa dokument. OCR-programvaran justerar dokumentet, och eventuellt även enskilda ord så att de justeras korrekt. Bilden konverteras till ett rent svartvitt format eftersom det är lättare än att skilja mellan gråtoner. Analyser utförs också för att identifiera och ta bort eventuella icke-textföremål.

Två huvudtyper av OCR-algoritmer används, matrismatchning och funktionsextraktion. Matrismatchning tar en bild av ett enda tecken och jämför den sedan med algoritmens konfigurerade teckensnitt pixel för pixel. Denna teknik kräver att tecknet är korrekt isolerat från allt annat innehåll och att teckensnittet ska inkluderas i OCR-programvaran. Denna typ av OCR fungerar inte heller för att känna igen handstil.

Funktionsextraktionsalgoritmer delar upp varje karaktär i funktioner, såsom linjer, kurvor och linjeskärningar. Denna teknik minskar avsevärt beroendet av att algoritmen tränas med kända typsnitt. Funktionsextraktion kan känna igen nya teckensnitt och transkribera dem, samt viss handskrift, även om noggrannheten inte är lika bra som för kända teckensnitt.

En del mer avancerad programvara använder sammanhanget för de omgivande bokstäverna för att hjälpa till att identifiera bokstäver som inte är lika tydliga. Till exempel, om ordet "hund" skrivs ut och OCR-algoritmen inte säkert kan avgöra om "o" är ett "a" eller ett "o", kan den använda en ordbok för att se om någon kombination av potentiella tecken gör ett känt ord. I det här fallet skulle OCR-algoritmen utesluta möjligheten för "a", eftersom "dag" inte är ett ord, medan "hund" är det.

Var används OCR?

En av de viktigaste användningsområdena för OCR är i postsystemet. OCR används för att automatiskt identifiera adressen till brev och paket, en uppgift den kan göra betydligt snabbare än vad människor kunde. I de fall där OCR-systemet inte kan läsa adressen till etiketten, kommer den att separeras ut för en människa att bearbeta manuellt istället.

OCR är användbart som ett tillgänglighetsverktyg för personer med synnedsättning i kombination med ett text-till-tal-verktyg. Google translate implementerar också OCR som en del av processen att översätta texten i bilder.


Leave a Comment

Hur man åtgärdar blinkande skärm i Google Chrome på Windows

Hur man åtgärdar blinkande skärm i Google Chrome på Windows

Lär dig hur du löser ett vanligt problem där skärmen blinkar i webbläsaren Google Chrome.

3 Steg för att Integrera ChatGPT i Word

3 Steg för att Integrera ChatGPT i Word

Undrar du hur du integrerar ChatGPT i Microsoft Word? Denna guide visar dig exakt hur du gör det med ChatGPT för Word-tillägget i 3 enkla steg.

LastPass: Ett fel uppstod när servern kontaktades

LastPass: Ett fel uppstod när servern kontaktades

Om LastPass misslyckas med att ansluta till sina servrar, rensa den lokala cacheminnet, uppdatera lösenordshanteraren och inaktivera dina webbläsartillägg.

Hur man kastar Microsoft Teams till TV

Hur man kastar Microsoft Teams till TV

Microsoft Teams stöder för närvarande inte casting av dina möten och samtal till din TV på ett inbyggt sätt. Men du kan använda en skärmspeglingsapp.

Skapa referenser i Word – Så här gör du och varför

Skapa referenser i Word – Så här gör du och varför

Referenser kan göra ditt dokument mycket mer användarvänligt, organiserat och tillgängligt. Denna guide lär dig hur du skapar referenser i Word.

Adobe Reader: Ändra standardzoominställning

Adobe Reader: Ändra standardzoominställning

I den här tutoren visar vi hur du ändrar standardzoominställningen i Adobe Reader.

Hur man Fixar OneDrive Felkod 0x8004de88

Hur man Fixar OneDrive Felkod 0x8004de88

Upptäck hur man fixar OneDrive felkod 0x8004de88 så att du kan få din molnlagring igång igen.

Hur man konverterar RAR-fil till ZIP i Windows

Hur man konverterar RAR-fil till ZIP i Windows

Har du några RAR-filer som du vill konvertera till ZIP-filer? Lär dig hur du konverterar RAR-filer till ZIP-format.

Hur man rensar cacheminnet i Google Chrome

Hur man rensar cacheminnet i Google Chrome

Håll cacheminnet rensat i din Google Chrome-webbläsare med dessa steg.

Inaktivera Apple Programuppdatering Skärm på Windows 11 och macOS

Inaktivera Apple Programuppdatering Skärm på Windows 11 och macOS

Vill du inaktivera Apple Programuppdatering Skärm och förhindra att den visas på din Windows 11-dator eller Mac? Prova dessa metoder nu!