Τι είναι η οπτική αναγνώριση χαρακτήρων;

Αν και είναι εύκολο να πάρετε ένα έγγραφο στον υπολογιστή σας και να λάβετε ένα φυσικό αντίγραφο με έναν εκτυπωτή, είναι γενικά πιο δύσκολο να κάνετε αντίστροφη κατεύθυνση. Αν και υπάρχουν σαρωτές και μπορούν να αποθηκεύσουν τα σαρωμένα έγγραφα ως εικόνα, αυτό δεν είναι ιδιαίτερα χρήσιμο εάν θέλετε να επεξεργαστείτε το έγγραφο. Για να μπορέσετε να επεξεργαστείτε ένα έγγραφο, θέλετε να χρησιμοποιήσετε μια τεχνολογία που ονομάζεται Optical Character Recognition ή OCR.

Πώς λειτουργεί η οπτική αναγνώριση χαρακτήρων;

Το OCR χρησιμοποιεί μια σειρά τεχνικών για την ακριβή ανάγνωση εγγράφων. Το λογισμικό OCR προσαρμόζει το έγγραφο, και ενδεχομένως ακόμη και μεμονωμένες λέξεις, ώστε να ευθυγραμμίζονται σωστά. Η εικόνα μετατρέπεται σε καθαρή ασπρόμαυρη μορφή, καθώς είναι ευκολότερο από τη διαφοροποίηση μεταξύ των αποχρώσεων του γκρι. Εκτελείται επίσης ανάλυση για τον εντοπισμό και την αφαίρεση τυχόν στοιχείων εκτός κειμένου.

Χρησιμοποιούνται δύο κύριοι τύποι αλγορίθμων OCR, η αντιστοίχιση μήτρας και η εξαγωγή χαρακτηριστικών. Η αντιστοίχιση μήτρας παίρνει μια εικόνα ενός μεμονωμένου χαρακτήρα και στη συνέχεια τη συγκρίνει με τις γραμματοσειρές που έχουν διαμορφωθεί από αλγόριθμους ανά εικονοστοιχείο. Αυτή η τεχνική απαιτεί ο χαρακτήρας να απομονωθεί σωστά από όλο το άλλο περιεχόμενο και να συμπεριληφθεί η γραμματοσειρά στο λογισμικό OCR. Αυτός ο τύπος OCR δεν λειτουργεί επίσης για την αναγνώριση χειρογράφου.

Οι αλγόριθμοι εξαγωγής χαρακτηριστικών αναλύουν κάθε χαρακτήρα σε χαρακτηριστικά, όπως γραμμές, καμπύλες και τομές γραμμών. Αυτή η τεχνική μειώνει σημαντικά την εξάρτηση από τον αλγόριθμο που εκπαιδεύεται με γνωστές γραμματοσειρές. Η εξαγωγή δυνατοτήτων είναι ικανή να αναγνωρίζει νέες γραμματοσειρές και να τις μεταγράφει, καθώς και κάποιο χειρόγραφο, αν και η ακρίβεια δεν είναι τόσο καλή όσο για τις γνωστές γραμματοσειρές.

Κάποιο πιο προηγμένο λογισμικό χρησιμοποιεί το περιβάλλον των γύρω γραμμάτων για να βοηθήσει στον εντοπισμό γραμμάτων που δεν είναι τόσο καθαρά. Για παράδειγμα, εάν η λέξη "dog" είναι τυπωμένη και ο αλγόριθμος OCR δεν μπορεί να πει με βεβαιότητα εάν το "o" είναι "a" ή ένα "o", μπορεί να χρησιμοποιήσει ένα λεξικό για να δει εάν υπάρχει συνδυασμός πιθανών χαρακτήρων κάνει μια γνωστή λέξη. Σε αυτήν την περίπτωση, ο αλγόριθμος OCR θα απέκλειε την πιθανότητα του «a», καθώς το «dag» δεν είναι λέξη, ενώ το «σκύλος» είναι.

Πού χρησιμοποιείται το OCR;

Μία από τις κύριες χρήσεις του OCR είναι στο ταχυδρομικό σύστημα. Το OCR χρησιμοποιείται για την αυτόματη αναγνώριση της διεύθυνσης επιστολών και δεμάτων, μια εργασία που μπορεί να κάνει πολύ πιο γρήγορα από ό,τι οι άνθρωποι. Σε περιπτώσεις όπου το σύστημα OCR δεν μπορεί να διαβάσει τη διεύθυνση της ετικέτας, θα διαχωριστεί για να την επεξεργαστεί ο άνθρωπος με μη αυτόματο τρόπο.

Το OCR είναι χρήσιμο ως εργαλείο προσβασιμότητας για άτομα με προβλήματα όρασης όταν συνδυάζεται με ένα εργαλείο μετατροπής κειμένου σε ομιλία. Το Google translate εφαρμόζει επίσης το OCR ως μέρος της διαδικασίας μετάφρασης του κειμένου σε εικόνες.


Leave a Comment

24H2 Ενημέρωση Σπάει το Auto HDR – Αυτά Είναι Όσα Μπορείτε Να Κάνετε Γι' Αυτό

24H2 Ενημέρωση Σπάει το Auto HDR – Αυτά Είναι Όσα Μπορείτε Να Κάνετε Γι' Αυτό

Για πολλούς χρήστες, η ενημέρωση 24H2 σπάει το auto HDR. Αυτός ο οδηγός εξηγεί πώς μπορείτε να διορθώσετε αυτό το πρόβλημα.

Spotify: Απενεργοποίηση Αυτόματης Εκκίνησης

Spotify: Απενεργοποίηση Αυτόματης Εκκίνησης

Το Spotify μπορεί να γίνει ενοχλητικό αν ανοίγει αυτόματα κάθε φορά που ξεκινάτε τον υπολογιστή σας. Απενεργοποιήστε την αυτόματη εκκίνηση χρησιμοποιώντας αυτά τα βήματα.

Πώς να Προβάλετε το Microsoft Teams στην Τηλεόραση

Πώς να Προβάλετε το Microsoft Teams στην Τηλεόραση

Το Microsoft Teams δεν υποστηρίζει επί του παρόντος την προβολή των συναντήσεων και των κλήσεών σας στην τηλεόρασή σας εγγενώς. Μπορείτε όμως να χρησιμοποιήσετε μια εφαρμογή αναπαραγωγής οθόνης.

Απενεργοποίηση Οθόνης Ενημέρωσης Λογισμικού Apple σε Windows 11 και macOS

Απενεργοποίηση Οθόνης Ενημέρωσης Λογισμικού Apple σε Windows 11 και macOS

Θέλετε να απενεργοποιήσετε την Οθόνη Ενημέρωσης Λογισμικού Apple και να αποτρέψετε την εμφάνισή της σε υπολογιστή Windows 11 ή Mac; Δοκιμάστε αυτές τις μεθόδους τώρα!

Πώς να καθαρίσετε την προσωρινή μνήμη στο Google Chrome

Πώς να καθαρίσετε την προσωρινή μνήμη στο Google Chrome

Διατηρήστε την προσωρινή μνήμη καθαρή στον ιστότοπο Google Chrome με αυτά τα βήματα.

Διόρθωση Microsoft Teams: Συγνώμη, δεν μπορέσαμε να σας συνδέσουμε

Διόρθωση Microsoft Teams: Συγνώμη, δεν μπορέσαμε να σας συνδέσουμε

Βλέπετε το σφάλμα Συγνώμη, δεν μπορέσαμε να σας συνδέσουμε στα MS Teams συχνά; Δοκιμάστε αυτές τις συμβουλές αντιμετώπισης προβλημάτων για να απαλλαγείτε από αυτό το ζήτημα τώρα!

Δημιουργία Διασταυρωμένων Αναφορών στο Word – Πώς να το κάνετε και γιατί

Δημιουργία Διασταυρωμένων Αναφορών στο Word – Πώς να το κάνετε και γιατί

Οι διασταυρωμένες αναφορές μπορούν να κάνουν το έγγραφό σας πολύ πιο φιλικό προς τον χρήστη, οργανωμένο και προσβάσιμο. Αυτός ο οδηγός θα σας διδάξει πώς να δημιουργήσετε διασταυρωμένες αναφορές στο Word.

10 Παραδείγματα Web 3.0: Είναι το μέλλον του Διαδικτύου;

10 Παραδείγματα Web 3.0: Είναι το μέλλον του Διαδικτύου;

WEB 3.0 (ή αλλιώς "Web3") είναι το μέλλον του Διαδικτύου, προσφέροντας δυνατότητες αποκέντρωσης και νέες τεχνολογίες που αλλάζουν τον τρόπο με τον οποίο αλληλεπιδρούμε με το διαδίκτυο.

Πώς να διαγράψετε Τάσεις αναζητήσεις στο Google

Πώς να διαγράψετε Τάσεις αναζητήσεις στο Google

Οι δημοφιλείς αναζητήσεις της Google μπορεί να αποσπούν την προσοχή. Αυτός ο οδηγός θα σας δείξει πώς να διαγράφετε τις δημοφιλείς αναζητήσεις στην Αναζήτηση Google και στην Εφαρμογή Google.

Τι είναι τα Snapchat Streaks και γιατί έχουν σημασία;

Τι είναι τα Snapchat Streaks και γιατί έχουν σημασία;

Οι ραβδώσεις Snapchat ή Snapstreaks αντιπροσωπεύουν τον αριθμό των ημερών που καταφέρατε να στείλετε μια φωτογραφία ή ένα στιγμιότυπο βίντεο στον φίλο σας στο Snapchat. Για τα παιδιά γυμνασίου, τα Snapstreak αντιπροσωπεύουν τη φιλία τους.