Τι είναι η οπτική αναγνώριση χαρακτήρων;

Τι είναι η οπτική αναγνώριση χαρακτήρων;

Αν και είναι εύκολο να πάρετε ένα έγγραφο στον υπολογιστή σας και να λάβετε ένα φυσικό αντίγραφο με έναν εκτυπωτή, είναι γενικά πιο δύσκολο να κάνετε αντίστροφη κατεύθυνση. Αν και υπάρχουν σαρωτές και μπορούν να αποθηκεύσουν τα σαρωμένα έγγραφα ως εικόνα, αυτό δεν είναι ιδιαίτερα χρήσιμο εάν θέλετε να επεξεργαστείτε το έγγραφο. Για να μπορέσετε να επεξεργαστείτε ένα έγγραφο, θέλετε να χρησιμοποιήσετε μια τεχνολογία που ονομάζεται Optical Character Recognition ή OCR.

Πώς λειτουργεί η οπτική αναγνώριση χαρακτήρων;

Το OCR χρησιμοποιεί μια σειρά τεχνικών για την ακριβή ανάγνωση εγγράφων. Το λογισμικό OCR προσαρμόζει το έγγραφο, και ενδεχομένως ακόμη και μεμονωμένες λέξεις, ώστε να ευθυγραμμίζονται σωστά. Η εικόνα μετατρέπεται σε καθαρή ασπρόμαυρη μορφή, καθώς είναι ευκολότερο από τη διαφοροποίηση μεταξύ των αποχρώσεων του γκρι. Εκτελείται επίσης ανάλυση για τον εντοπισμό και την αφαίρεση τυχόν στοιχείων εκτός κειμένου.

Χρησιμοποιούνται δύο κύριοι τύποι αλγορίθμων OCR, η αντιστοίχιση μήτρας και η εξαγωγή χαρακτηριστικών. Η αντιστοίχιση μήτρας παίρνει μια εικόνα ενός μεμονωμένου χαρακτήρα και στη συνέχεια τη συγκρίνει με τις γραμματοσειρές που έχουν διαμορφωθεί από αλγόριθμους ανά εικονοστοιχείο. Αυτή η τεχνική απαιτεί ο χαρακτήρας να απομονωθεί σωστά από όλο το άλλο περιεχόμενο και να συμπεριληφθεί η γραμματοσειρά στο λογισμικό OCR. Αυτός ο τύπος OCR δεν λειτουργεί επίσης για την αναγνώριση χειρογράφου.

Οι αλγόριθμοι εξαγωγής χαρακτηριστικών αναλύουν κάθε χαρακτήρα σε χαρακτηριστικά, όπως γραμμές, καμπύλες και τομές γραμμών. Αυτή η τεχνική μειώνει σημαντικά την εξάρτηση από τον αλγόριθμο που εκπαιδεύεται με γνωστές γραμματοσειρές. Η εξαγωγή δυνατοτήτων είναι ικανή να αναγνωρίζει νέες γραμματοσειρές και να τις μεταγράφει, καθώς και κάποιο χειρόγραφο, αν και η ακρίβεια δεν είναι τόσο καλή όσο για τις γνωστές γραμματοσειρές.

Κάποιο πιο προηγμένο λογισμικό χρησιμοποιεί το περιβάλλον των γύρω γραμμάτων για να βοηθήσει στον εντοπισμό γραμμάτων που δεν είναι τόσο καθαρά. Για παράδειγμα, εάν η λέξη "dog" είναι τυπωμένη και ο αλγόριθμος OCR δεν μπορεί να πει με βεβαιότητα εάν το "o" είναι "a" ή ένα "o", μπορεί να χρησιμοποιήσει ένα λεξικό για να δει εάν υπάρχει συνδυασμός πιθανών χαρακτήρων κάνει μια γνωστή λέξη. Σε αυτήν την περίπτωση, ο αλγόριθμος OCR θα απέκλειε την πιθανότητα του «a», καθώς το «dag» δεν είναι λέξη, ενώ το «σκύλος» είναι.

Πού χρησιμοποιείται το OCR;

Μία από τις κύριες χρήσεις του OCR είναι στο ταχυδρομικό σύστημα. Το OCR χρησιμοποιείται για την αυτόματη αναγνώριση της διεύθυνσης επιστολών και δεμάτων, μια εργασία που μπορεί να κάνει πολύ πιο γρήγορα από ό,τι οι άνθρωποι. Σε περιπτώσεις όπου το σύστημα OCR δεν μπορεί να διαβάσει τη διεύθυνση της ετικέτας, θα διαχωριστεί για να την επεξεργαστεί ο άνθρωπος με μη αυτόματο τρόπο.

Το OCR είναι χρήσιμο ως εργαλείο προσβασιμότητας για άτομα με προβλήματα όρασης όταν συνδυάζεται με ένα εργαλείο μετατροπής κειμένου σε ομιλία. Το Google translate εφαρμόζει επίσης το OCR ως μέρος της διαδικασίας μετάφρασης του κειμένου σε εικόνες.


10 Παραδείγματα Web 3.0: Είναι το μέλλον του Διαδικτύου;

10 Παραδείγματα Web 3.0: Είναι το μέλλον του Διαδικτύου;

WEB 3.0 (ή αλλιώς "Web3") είναι το μέλλον του Διαδικτύου, προσφέροντας δυνατότητες αποκέντρωσης και νέες τεχνολογίες που αλλάζουν τον τρόπο με τον οποίο αλληλεπιδρούμε με το διαδίκτυο.

Πώς να διαγράψετε Τάσεις αναζητήσεις στο Google

Πώς να διαγράψετε Τάσεις αναζητήσεις στο Google

Οι δημοφιλείς αναζητήσεις της Google μπορεί να αποσπούν την προσοχή. Αυτός ο οδηγός θα σας δείξει πώς να διαγράφετε τις δημοφιλείς αναζητήσεις στην Αναζήτηση Google και στην Εφαρμογή Google.

Τι είναι τα Snapchat Streaks και γιατί έχουν σημασία;

Τι είναι τα Snapchat Streaks και γιατί έχουν σημασία;

Οι ραβδώσεις Snapchat ή Snapstreaks αντιπροσωπεύουν τον αριθμό των ημερών που καταφέρατε να στείλετε μια φωτογραφία ή ένα στιγμιότυπο βίντεο στον φίλο σας στο Snapchat. Για τα παιδιά γυμνασίου, τα Snapstreak αντιπροσωπεύουν τη φιλία τους.

Τι να κάνετε εάν το Gmail δεν λειτουργεί; 11 Γρήγορες επιδιορθώσεις

Τι να κάνετε εάν το Gmail δεν λειτουργεί; 11 Γρήγορες επιδιορθώσεις

Ανακαλύψτε 11 γρήγορες επιδιορθώσεις για τα προβλήματα του Gmail που δεν λειτουργεί. Μάθετε πώς να επιλύσετε το πρόβλημα και να επιστρέψετε στην επικοινωνία σας.

Πώς να διορθώσετε ιστοσελίδες που δεν φορτώνουν

Πώς να διορθώσετε ιστοσελίδες που δεν φορτώνουν

Προβλήματα φόρτωσης ιστοσελίδων και πώς να τα διορθώσετε. Συμβουλές για τον υπολογιστή σας.

Google Maps: Πώς να αποφύγετε τους χωματόδρομους

Google Maps: Πώς να αποφύγετε τους χωματόδρομους

Ανακαλύψτε πώς να αποφύγετε χωματόδρομους με τους Χάρτες Google και απολαύστε ασφαλείς διαδρομές.

5 πιο συνηθισμένα προβλήματα PS4 μαζί με τις γρήγορες επιδιορθώσεις τους

5 πιο συνηθισμένα προβλήματα PS4 μαζί με τις γρήγορες επιδιορθώσεις τους

Ανακαλύψτε τα 5 πιο κοινά προβλήματα του PS4 και τις γρήγορες επιδιορθώσεις τους για μια καλύτερη εμπειρία παιχνιδιού.

Πώς να διαγράψετε τα μηνύματα του Facebook Messenger και για τα δύο μέρη

Πώς να διαγράψετε τα μηνύματα του Facebook Messenger και για τα δύο μέρη

Όλοι έχουν στείλει ένα μήνυμα που σχεδόν αμέσως μετάνιωσαν που έστειλαν. Είναι μέρος της ψηφιακής εποχής -- η άμεση ικανότητα να ανταποκρίνεσαι σε κάποιον κάνει λίγο πιο επικίνδυνο το σύννεφο.

Outlook: Δεν εμφανίζονται όλα τα μηνύματα ηλεκτρονικού ταχυδρομείου στα Εισερχόμενα

Outlook: Δεν εμφανίζονται όλα τα μηνύματα ηλεκτρονικού ταχυδρομείου στα Εισερχόμενα

Πολλοί χρήστες του Outlook παραπονέθηκαν ότι δεν είναι ορατά όλα τα email τους στο φάκελο Εισερχόμενα. Ελέγξτε τα φίλτρα email σας και απενεργοποιήστε τα.

Πώς να αλλάξετε τη γραμματοσειρά στο Google Chrome

Πώς να αλλάξετε τη γραμματοσειρά στο Google Chrome

Μάθετε πώς να αλλάξετε τις γραμματοσειρές στον Google Chrome για μια πιο προσωπική εμπειρία περιήγησης.