iPhone: Πώς να χρησιμοποιήσετε τις δυνατότητες ανίχνευσης κειμένου iOS

Το Vision στο iOS 11 έχει όλα όσα χρειάζεστε για να δημιουργήσετε μια εφαρμογή που μπορεί να αναγνωρίζει χαρακτήρες κειμένου με την υλοποίηση να γίνεται ταυτόχρονα. Δεν χρειάζεστε γνώσεις τεχνικής κωδικοποίησης – η πλοήγηση στη λειτουργία είναι αρκετά απλή. Επιπλέον, η υλοποίηση είναι απρόσκοπτη.

Πλαίσιο Οράματος

Το πλαίσιο όρασης σάς δίνει τη δυνατότητα να υλοποιήσετε εύκολα οποιαδήποτε εργασία που περιλαμβάνει λεπτομέρειες υπολογιστή. Η δομή εκτελεί εντοπισμό ορόσημων προσώπων και προσώπων, αναγνώριση γραμμωτού κώδικα, καταχώρηση εικόνας, παρακολούθηση γενικών χαρακτηριστικών και ανίχνευση κειμένου. Το Vision σάς επιτρέπει επίσης να χρησιμοποιείτε προσαρμοσμένα μοντέλα Core ML για εργασίες όπως ταξινόμηση ή ανίχνευση αντικειμένων.

VN DetectTextRectanglesRequest

Το  VN DetectTextRectanglesRequest  είναι ένα αίτημα ανάλυσης εικόνας που βρίσκει περιοχές ορατού κειμένου σε μια εικόνα. το χαρακτηριστικό επιστρέφει χαρακτήρες κειμένου ως ορθογώνιο πλαίσιο οριοθέτησης με προέλευση και μέγεθος.

Εάν έχετε συνηθίσει να χρησιμοποιείτε το swift και έχετε προγραμματίσει για λίγο, τότε πιθανότατα αναρωτιέστε ποια είναι η χρήση του Vision όταν υπάρχουν άλλες δυνατότητες όπως το image και το AVFoundation. Λοιπόν, το Vision είναι πιο ακριβές και πιο απλό. Η δυνατότητα είναι επίσης διαθέσιμη σε διάφορες πλατφόρμες. Ωστόσο, η χρήση του Vision ενδέχεται να απαιτεί περισσότερη ισχύ επεξεργασίας και χρόνο επεξεργασίας.

Για να χρησιμοποιήσετε το Vision για ανίχνευση κειμένου, θα χρειαστείτε το Xcode 9 και μια συσκευή που εκτελεί iOS 11.

Δημιουργία κάμερας με Avcapture

Πρώτα, πρέπει να δημιουργήσετε μια κάμερα με το  AVCapture . Αυτό γίνεται με την προετοιμασία ενός αντικειμένου AVcapturesession για λήψη σε πραγματικό χρόνο ή εκτός σύνδεσης. Μετά από αυτό, πραγματοποιήστε τη συνεδρία στη σύνδεση της συσκευής.

Για να εξοικονομήσετε χρόνο από τη δημιουργία μιας διεπαφής χρήστη της εφαρμογής σας, εξετάστε το ενδεχόμενο να έχετε ένα αρχικό έργο, αρχικά, αυτό θα σας δώσει χρόνο να εστιάσετε στην εκμάθηση του πλαισίου του Vision.

Ανοίξτε το αρχικό σας έργο. Οι προβολές στο σενάριο θα πρέπει να είναι έτοιμες και ρυθμισμένες για εσάς.

Στο  ViewController.swift,  αναζητήστε την ενότητα κώδικα με λειτουργίες και εξόδους.

Κάτω από την έξοδο - ImageView, δηλώστε μια συνεδρία για  AVcapturesession  - αυτό χρησιμοποιείται όποτε θέλετε να εκτελούνται ενέργειες με βάση μια ζωντανή ροή.

Ρυθμίστε το  AVcapturesession  και το  AVmediatype  σε βίντεο, αφού θα εκτελέσετε τη λήψη της κάμερας για να μπορείτε να εκτελείται συνεχώς

Καθορίστε τη συσκευή εξόδου και εισόδου

Η είσοδος είναι αυτό που θα δει η κάμερα και η έξοδος είναι το βίντεο σε μια καθορισμένη μορφή τύπου KCVPixelFormatType_32GRA.

Τέλος, προσθέστε ένα  υποστρώμα  που περιέχει βίντεο στο  imageView  και ξεκινήστε τη συνεδρία. Η συνάρτηση είναι γνωστή ως  inViewdidload.  Πρέπει επίσης να ρυθμίσετε το πλαίσιο του στρώματος.

Καλέστε τη συνάρτηση στη   μέθοδο viewWillAppear .

Καθώς τα όρια δεν έχουν ακόμη οριστικοποιηθεί, παρακάμψτε τη  μέθοδο viewDidLayoutSubviews ( )  για να ενημερώσετε τα δεσμευμένα επίπεδα.

Μετά την κυκλοφορία του iOS 10, απαιτείται μια πρόσθετη καταχώριση στο Info.plist, κάτι που παρέχει έναν λόγο για τη χρήση της κάμερας. Θα πρέπει επίσης να ορίσετε Privacy-Camera Usage Description.

Ανίχνευση κειμένου; Πώς λειτουργεί το Vision Framework

Υπάρχουν τρία βήματα για την εφαρμογή του Vision στην εφαρμογή.

Handlers –  αυτό συμβαίνει όταν θέλετε το πλαίσιο να κάνει κάτι μετά την κλήση του αιτήματος.

Παρατηρήσεις –  αυτό είναι που θέλετε να κάνετε με τα δεδομένα που παρέχετε ξεκινώντας με ένα αίτημα

Αιτήματα -  αυτό συμβαίνει όταν ζητάτε πλαίσιο ανίχνευσης

Στην ιδανική περίπτωση, δημιουργείτε ένα αίτημα κειμένου ως  VNdetecttextrectanglesrequest . Αυτό είναι ένα είδος  VN request  που περιορίζεται γύρω από το κείμενο. Αφού το πλαίσιο ολοκληρώσει την εφαρμογή, προχωράτε στην κλήση της   συνάρτησης Detexthandler . Θα θέλετε επίσης να μάθετε το ακριβές πλαίσιο που αναγνωρίστηκε, ορίστε το σε  Reportcharacterboxes =True.

Μετά από αυτό, ορίστε τις παρατηρήσεις που περιέχουν όλα τα αποτελέσματα του  VNdetecttextrectanglesrequest , θυμηθείτε να προσθέσετε το Vision στην κάμερα εξόδου. Εφόσον το Vision εκθέτει API υψηλού επιπέδου, η εργασία με αυτό είναι ασφαλής.

Η συνάρτηση ελέγχει εάν  υπάρχει το  Cmsamplebuffer και η έξοδος  PutOut Avcapture . Στη συνέχεια, θα πρέπει να προχωρήσετε στη δημιουργία μιας μεταβλητής  Requestoptions  ως 1 Τύπος λεξικού  VNimageoption . Η   επιλογή VNmage είναι ένας τύπος δομής που περιέχει ιδιότητες και δεδομένα από την κάμερα. Στη συνέχεια, θα πρέπει να δημιουργήσετε το  VNimagerequesthandler  και να εκτελέσετε το αίτημα κειμένου.

Εντοπίστηκε σχεδίαση περιγραμμάτων γύρω από το κείμενο

Μπορείτε να ξεκινήσετε έχοντας το πλαίσιο για να σχεδιάσετε δύο πλαίσια, ένα για κάθε γράμμα που εντοπίζει και το άλλο για κάθε λέξη. Οι πίνακες είναι ο συνδυασμός όλων των πλαισίων χαρακτήρων που θα βρει το αίτημά σας.

  • Καθορίστε τα σημεία στην άποψή σας για να σας βοηθήσουν να τοποθετήσετε τα πλαίσια.
  • Μετά από αυτό, δημιουργήστε ένα  CALaye r. χρησιμοποιήστε την  παρατήρηση VNrectangle  για να ορίσετε τους περιορισμούς σας, διευκολύνοντας τη διαδικασία σύνταξης του πλαισίου.

Τώρα έχετε διαμορφώσει όλες τις λειτουργίες σας.

Για να συνδέσετε τις τελείες σας, ξεκινήστε με την ασύγχρονη εκτέλεση του κωδικού σας. Στη συνέχεια, θα πρέπει να ελέγξετε εάν υπάρχει μια περιοχή στα αποτελέσματά σας από το  VNTextObservation .

Τώρα μπορείτε να καλέσετε τη συνάρτησή σας, η οποία θα σχεδιάσει ένα πλαίσιο εντός της περιοχής. Ελέγξτε για να δείτε αν υπάρχουν πλαίσια χαρακτήρων εντός της περιοχής και, στη συνέχεια, καλέστε την υπηρεσία που φέρνει ένα πλαίσιο γύρω από κάθε γράμμα.

Μετά από αυτό, δημιουργήστε μια μεταβλητή  RequestOptions. Τώρα μπορείτε να δημιουργήσετε ένα  αντικείμενο VNImageRequestHandler  και να εκτελέσετε το αίτημα κειμένου που δημιουργήσατε.

Τέλος, το τελευταίο βήμα είναι να εκτελέσετε τον κωδικό όρασής σας με τη ζωντανή ροή. Θα χρειαστεί να πάρετε την έξοδο βίντεο και να το μετατρέψετε σε  Cmsamplebuffer.

Πρόσθετες Συμβουλές

Προσπαθήστε πάντα να περικόψετε την εικόνα και να επεξεργάζεστε μόνο την ενότητα που χρειάζεστε. Αυτό θα μειώσει τον χρόνο επεξεργασίας και το αποτύπωμα μνήμης

Ενεργοποιήστε τη διόρθωση γλώσσας όταν ασχολείστε με μη αριθμητικούς χαρακτήρες και, στη συνέχεια, απενεργοποιήστε τη όταν έχετε να κάνετε με έναν αριθμητικό χαρακτήρα

Συμπεριλάβετε επικύρωση για αναγνωρισμένες συμβολοσειρές αριθμών για να επιβεβαιώσετε την ακρίβεια και να εξαλείψετε την εμφάνιση ψευδούς τιμής στον χρήστη.

Ο ελεγκτής κάμερας εγγράφων είναι ο καλύτερος σύντροφος για την αναγνώριση κειμένου, καθώς η ποιότητα της εικόνας παίζει σημαντικό ρόλο στην αναγνώριση κειμένου.

Εξετάστε το ενδεχόμενο να ορίσετε ένα ελάχιστο ύψος κειμένου για να αυξήσετε την απόδοση.

Με το Vision, έχετε όλα όσα χρειάζεστε για την αναγνώριση κειμένου. Δεδομένου ότι το Vision είναι εύκολο στη χρήση και απαιτεί λίγο χρόνο για την εφαρμογή του, η χρήση του είναι σχεδόν ισοδύναμη με το παιχνίδι με Lego. Δοκιμάστε να δοκιμάσετε την εφαρμογή σας σε διαφορετικά αντικείμενα, γραμματοσειρές, φωτισμό και μεγέθη. Μπορείτε επίσης να εντυπωσιάσετε τον εαυτό σας συνδυάζοντας το Vision με το Core ML.


Leave a Comment

9 ρυθμίσεις απορρήτου iPhone που πρέπει να ενεργοποιήσετε τώρα

9 ρυθμίσεις απορρήτου iPhone που πρέπει να ενεργοποιήσετε τώρα

Η Apple κάνει καλύτερη δουλειά από τις περισσότερες εταιρείες όσον αφορά το απόρρητο. Αλλά δεν είναι όλες οι προεπιλεγμένες ρυθμίσεις στο iPhone προς το συμφέρον του χρήστη.

Πώς να ανοίξετε το ChatGPT με το κουμπί δράσης στο iPhone

Πώς να ανοίξετε το ChatGPT με το κουμπί δράσης στο iPhone

Μέσω αυτού του κουμπιού δράσης, μπορείτε να καλείτε το ChatGPT όποτε θέλετε από το τηλέφωνό σας. Ακολουθεί ένας οδηγός για το πώς να ανοίξετε το ChatGPT χρησιμοποιώντας το κουμπί δράσης στο iPhone.

Πώς να τραβήξετε μεγάλα στιγμιότυπα οθόνης στο iPhone, να τραβήξετε στιγμιότυπα οθόνης με κύλιση στο iPhone

Πώς να τραβήξετε μεγάλα στιγμιότυπα οθόνης στο iPhone, να τραβήξετε στιγμιότυπα οθόνης με κύλιση στο iPhone

Το πώς να τραβήξετε ένα μεγάλο στιγμιότυπο οθόνης στο iPhone σας βοηθά να καταγράψετε εύκολα ολόκληρη την ιστοσελίδα. Η λειτουργία κύλισης στιγμιότυπου οθόνης στο iPhone είναι διαθέσιμη σε iOS 13, iOS 14 και εδώ είναι ένας λεπτομερής οδηγός για το πώς να τραβήξετε ένα μεγάλο στιγμιότυπο οθόνης στο iPhone.

Οι οδηγίες για την αλλαγή του κωδικού πρόσβασης iCloud είναι πολύ απλές

Οι οδηγίες για την αλλαγή του κωδικού πρόσβασης iCloud είναι πολύ απλές

Για να αλλάξετε τον κωδικό πρόσβασης iCloud, μπορείτε να το κάνετε με πολλούς διαφορετικούς τρόπους. Μπορείτε να αλλάξετε τον κωδικό πρόσβασης iCloud στον υπολογιστή σας ή στο τηλέφωνό σας μέσω μιας εφαρμογής υποστήριξης.

Οδηγίες για την ένταξη σε κοινόχρηστα άλμπουμ στο iPhone

Οδηγίες για την ένταξη σε κοινόχρηστα άλμπουμ στο iPhone

Όταν στέλνετε ένα συλλογικό άλμπουμ στο iPhone σε κάποιον άλλο, θα πρέπει να συμφωνήσει να συμμετάσχει σε αυτό. Υπάρχουν διάφοροι τρόποι για να αποδεχτείτε προσκλήσεις για κοινή χρήση ενός άλμπουμ στο iPhone, όπως φαίνεται παρακάτω.

Πώς να βρείτε χαμένα AirPods

Πώς να βρείτε χαμένα AirPods

Επειδή τα AirPods είναι μικρά και ελαφριά, μερικές φορές μπορεί να είναι εύκολο να τα χάσετε. Τα καλά νέα είναι ότι πριν αρχίσετε να γκρεμίζετε το σπίτι σας ψάχνοντας για τα ακουστικά που λείπουν, μπορείτε να τα εντοπίσετε χρησιμοποιώντας το iPhone σας.

4 λειτουργίες του iPhone που δεν λειτουργούν σε ορισμένες χώρες

4 λειτουργίες του iPhone που δεν λειτουργούν σε ορισμένες χώρες

Γνωρίζατε ότι ανάλογα με την περιοχή κατασκευής του iPhone σας, ενδέχεται να υπάρχουν διαφορές σε σύγκριση με τα iPhone που πωλούνται σε άλλες χώρες;

Πώς να αναζητήσετε εικόνες με το Google Images στο τηλέφωνό σας

Πώς να αναζητήσετε εικόνες με το Google Images στο τηλέφωνό σας

Η αντίστροφη αναζήτηση εικόνων στο iPhone είναι πολύ απλή όταν μπορείτε να χρησιμοποιήσετε το πρόγραμμα περιήγησης στη συσκευή ή να χρησιμοποιήσετε ορισμένες εφαρμογές τρίτων για περισσότερες επιλογές αναζήτησης.

Οι οδηγίες για την πραγματοποίηση γρήγορων κλήσεων στο iPhone είναι πολύ απλές

Οι οδηγίες για την πραγματοποίηση γρήγορων κλήσεων στο iPhone είναι πολύ απλές

Αν χρειάζεται να επικοινωνείτε συχνά με κάποιον, μπορείτε να ρυθμίσετε τις γρήγορες κλήσεις στο iPhone σας, με μερικά απλά βήματα.

Οδηγίες για την περιστροφή της οθόνης iPhone σε όλα τα μοντέλα

Οδηγίες για την περιστροφή της οθόνης iPhone σε όλα τα μοντέλα

Η οριζόντια περιστροφή της οθόνης στο iPhone σάς βοηθά να παρακολουθείτε ταινίες ή Netflix, να βλέπετε PDF, να παίζετε παιχνίδια,... πιο εύκολα και να έχετε μια καλύτερη εμπειρία.