Τι είναι η οπτική αναγνώριση χαρακτήρων;

Αν και είναι εύκολο να πάρετε ένα έγγραφο στον υπολογιστή σας και να λάβετε ένα φυσικό αντίγραφο με έναν εκτυπωτή, είναι γενικά πιο δύσκολο να κάνετε αντίστροφη κατεύθυνση. Αν και υπάρχουν σαρωτές και μπορούν να αποθηκεύσουν τα σαρωμένα έγγραφα ως εικόνα, αυτό δεν είναι ιδιαίτερα χρήσιμο εάν θέλετε να επεξεργαστείτε το έγγραφο. Για να μπορέσετε να επεξεργαστείτε ένα έγγραφο, θέλετε να χρησιμοποιήσετε μια τεχνολογία που ονομάζεται Optical Character Recognition ή OCR.

Πώς λειτουργεί η οπτική αναγνώριση χαρακτήρων;

Το OCR χρησιμοποιεί μια σειρά τεχνικών για την ακριβή ανάγνωση εγγράφων. Το λογισμικό OCR προσαρμόζει το έγγραφο, και ενδεχομένως ακόμη και μεμονωμένες λέξεις, ώστε να ευθυγραμμίζονται σωστά. Η εικόνα μετατρέπεται σε καθαρή ασπρόμαυρη μορφή, καθώς είναι ευκολότερο από τη διαφοροποίηση μεταξύ των αποχρώσεων του γκρι. Εκτελείται επίσης ανάλυση για τον εντοπισμό και την αφαίρεση τυχόν στοιχείων εκτός κειμένου.

Χρησιμοποιούνται δύο κύριοι τύποι αλγορίθμων OCR, η αντιστοίχιση μήτρας και η εξαγωγή χαρακτηριστικών. Η αντιστοίχιση μήτρας παίρνει μια εικόνα ενός μεμονωμένου χαρακτήρα και στη συνέχεια τη συγκρίνει με τις γραμματοσειρές που έχουν διαμορφωθεί από αλγόριθμους ανά εικονοστοιχείο. Αυτή η τεχνική απαιτεί ο χαρακτήρας να απομονωθεί σωστά από όλο το άλλο περιεχόμενο και να συμπεριληφθεί η γραμματοσειρά στο λογισμικό OCR. Αυτός ο τύπος OCR δεν λειτουργεί επίσης για την αναγνώριση χειρογράφου.

Οι αλγόριθμοι εξαγωγής χαρακτηριστικών αναλύουν κάθε χαρακτήρα σε χαρακτηριστικά, όπως γραμμές, καμπύλες και τομές γραμμών. Αυτή η τεχνική μειώνει σημαντικά την εξάρτηση από τον αλγόριθμο που εκπαιδεύεται με γνωστές γραμματοσειρές. Η εξαγωγή δυνατοτήτων είναι ικανή να αναγνωρίζει νέες γραμματοσειρές και να τις μεταγράφει, καθώς και κάποιο χειρόγραφο, αν και η ακρίβεια δεν είναι τόσο καλή όσο για τις γνωστές γραμματοσειρές.

Κάποιο πιο προηγμένο λογισμικό χρησιμοποιεί το περιβάλλον των γύρω γραμμάτων για να βοηθήσει στον εντοπισμό γραμμάτων που δεν είναι τόσο καθαρά. Για παράδειγμα, εάν η λέξη "dog" είναι τυπωμένη και ο αλγόριθμος OCR δεν μπορεί να πει με βεβαιότητα εάν το "o" είναι "a" ή ένα "o", μπορεί να χρησιμοποιήσει ένα λεξικό για να δει εάν υπάρχει συνδυασμός πιθανών χαρακτήρων κάνει μια γνωστή λέξη. Σε αυτήν την περίπτωση, ο αλγόριθμος OCR θα απέκλειε την πιθανότητα του «a», καθώς το «dag» δεν είναι λέξη, ενώ το «σκύλος» είναι.

Πού χρησιμοποιείται το OCR;

Μία από τις κύριες χρήσεις του OCR είναι στο ταχυδρομικό σύστημα. Το OCR χρησιμοποιείται για την αυτόματη αναγνώριση της διεύθυνσης επιστολών και δεμάτων, μια εργασία που μπορεί να κάνει πολύ πιο γρήγορα από ό,τι οι άνθρωποι. Σε περιπτώσεις όπου το σύστημα OCR δεν μπορεί να διαβάσει τη διεύθυνση της ετικέτας, θα διαχωριστεί για να την επεξεργαστεί ο άνθρωπος με μη αυτόματο τρόπο.

Το OCR είναι χρήσιμο ως εργαλείο προσβασιμότητας για άτομα με προβλήματα όρασης όταν συνδυάζεται με ένα εργαλείο μετατροπής κειμένου σε ομιλία. Το Google translate εφαρμόζει επίσης το OCR ως μέρος της διαδικασίας μετάφρασης του κειμένου σε εικόνες.


Leave a Comment

Πώς να Μετατρέψετε τη Χειρόγραφη Γραφή σε Κείμενο με το Samsung Notes

Πώς να Μετατρέψετε τη Χειρόγραφη Γραφή σε Κείμενο με το Samsung Notes

Αν ψάχνετε μια αναζωογονητική εναλλακτική λύση στο παραδοσιακό πληκτρολόγιο οθόνης, το Samsung Galaxy S23 Ultra παρέχει μια εξαιρετική λύση. Με το

Adobe Reader: Αλλαγή της Προεπιλεγμένης Ρυθμίσεως Ζουμ

Adobe Reader: Αλλαγή της Προεπιλεγμένης Ρυθμίσεως Ζουμ

Σε αυτό το οδηγό, σας δείχνουμε πώς να αλλάξετε την προεπιλεγμένη ρύθμιση ζουμ στο Adobe Reader.

Adobe Reader: Αλλαγή χρώματος επισήμανσης

Adobe Reader: Αλλαγή χρώματος επισήμανσης

Σας δείχνουμε πώς να αλλάξετε το χρώμα επισήμανσης για κείμενο και πεδία κειμένου στο Adobe Reader με αυτόν τον βήμα προς βήμα οδηγό.

Πώς να διορθώσετε τον κωδικό σφάλματος OneDrive 0x8004de88

Πώς να διορθώσετε τον κωδικό σφάλματος OneDrive 0x8004de88

Ανακαλύψτε πώς να διορθώσετε τον κωδικό σφάλματος OneDrive 0x8004de88 ώστε να επαναφέρετε την αποθήκευση στο cloud.

Πώς να διορθώσετε την αναλαμπή οθόνης του Google Chrome στα Windows

Πώς να διορθώσετε την αναλαμπή οθόνης του Google Chrome στα Windows

Μάθετε πώς να λύσετε ένα κοινό πρόβλημα όπου η οθόνη αναβοσβήνει στον φυλλομετρητή ιστού Google Chrome.

Σημειώσεις Live Events του Teams: Απενεργοποίηση Ανώνυμων Ερωτήσεων

Σημειώσεις Live Events του Teams: Απενεργοποίηση Ανώνυμων Ερωτήσεων

Μέχρι στιγμής, δεν είναι δυνατή η απενεργοποίηση ανώνυμων ερωτήσεων στα Live Events του Microsoft Teams. Ακόμη και οι εγγεγραμμένοι χρήστες μπορούν να υποβάλουν ανώνυμες ερωτήσεις.

LastPass: Ένα σφάλμα ocurrió κατά την επαφή με τον διακομιστή

LastPass: Ένα σφάλμα ocurrió κατά την επαφή με τον διακομιστή

Εάν το LastPass αποτυγχάνει να συνδεθεί στους διακομιστές του, καθαρίστε την τοπική προσωρινή μνήμη, ενημερώστε το διαχειριστή κωδικών πρόσβασης και απενεργοποιήστε τις επεκτάσεις του προγράμματος περιήγησης σας.

3 Βήματα για την Ενσωμάτωση του ChatGPT στο Word

3 Βήματα για την Ενσωμάτωση του ChatGPT στο Word

Αναρωτιέστε πώς να ενσωματώσετε το ChatGPT στο Microsoft Word; Αυτός ο οδηγός σας δείχνει ακριβώς πώς να το κάνετε με το πρόσθετο ChatGPT for Word σε 3 εύκολα βήματα.

Πώς να ρυθμίσετε μια επαναλαμβανόμενη συνάντηση στο Teams

Πώς να ρυθμίσετε μια επαναλαμβανόμενη συνάντηση στο Teams

Χρειάζεστε να προγραμματίσετε επαναλαμβανόμενες συναντήσεις στο MS Teams με τα ίδια μέλη της ομάδας; Μάθετε πώς να ρυθμίσετε μια επαναλαμβανόμενη συνάντηση στο Teams.

Πώς να αλλάξετε το User Agent στο Safari

Πώς να αλλάξετε το User Agent στο Safari

Βρείτε εδώ τις λεπτομερείς οδηγίες για το πώς να αλλάξετε το User Agent String στον περιηγητή Apple Safari για MacOS.