iPhone: Πώς να χρησιμοποιήσετε τις δυνατότητες ανίχνευσης κειμένου iOS

Το Vision στο iOS 11 έχει όλα όσα χρειάζεστε για να δημιουργήσετε μια εφαρμογή που μπορεί να αναγνωρίζει χαρακτήρες κειμένου με την υλοποίηση να γίνεται ταυτόχρονα. Δεν χρειάζεστε γνώσεις τεχνικής κωδικοποίησης – η πλοήγηση στη λειτουργία είναι αρκετά απλή. Επιπλέον, η υλοποίηση είναι απρόσκοπτη.

Πλαίσιο Οράματος

Το πλαίσιο όρασης σάς δίνει τη δυνατότητα να υλοποιήσετε εύκολα οποιαδήποτε εργασία που περιλαμβάνει λεπτομέρειες υπολογιστή. Η δομή εκτελεί εντοπισμό ορόσημων προσώπων και προσώπων, αναγνώριση γραμμωτού κώδικα, καταχώρηση εικόνας, παρακολούθηση γενικών χαρακτηριστικών και ανίχνευση κειμένου. Το Vision σάς επιτρέπει επίσης να χρησιμοποιείτε προσαρμοσμένα μοντέλα Core ML για εργασίες όπως ταξινόμηση ή ανίχνευση αντικειμένων.

VN DetectTextRectanglesRequest

Το  VN DetectTextRectanglesRequest  είναι ένα αίτημα ανάλυσης εικόνας που βρίσκει περιοχές ορατού κειμένου σε μια εικόνα. το χαρακτηριστικό επιστρέφει χαρακτήρες κειμένου ως ορθογώνιο πλαίσιο οριοθέτησης με προέλευση και μέγεθος.

Εάν έχετε συνηθίσει να χρησιμοποιείτε το swift και έχετε προγραμματίσει για λίγο, τότε πιθανότατα αναρωτιέστε ποια είναι η χρήση του Vision όταν υπάρχουν άλλες δυνατότητες όπως το image και το AVFoundation. Λοιπόν, το Vision είναι πιο ακριβές και πιο απλό. Η δυνατότητα είναι επίσης διαθέσιμη σε διάφορες πλατφόρμες. Ωστόσο, η χρήση του Vision ενδέχεται να απαιτεί περισσότερη ισχύ επεξεργασίας και χρόνο επεξεργασίας.

Για να χρησιμοποιήσετε το Vision για ανίχνευση κειμένου, θα χρειαστείτε το Xcode 9 και μια συσκευή που εκτελεί iOS 11.

Δημιουργία κάμερας με Avcapture

Πρώτα, πρέπει να δημιουργήσετε μια κάμερα με το  AVCapture . Αυτό γίνεται με την προετοιμασία ενός αντικειμένου AVcapturesession για λήψη σε πραγματικό χρόνο ή εκτός σύνδεσης. Μετά από αυτό, πραγματοποιήστε τη συνεδρία στη σύνδεση της συσκευής.

Για να εξοικονομήσετε χρόνο από τη δημιουργία μιας διεπαφής χρήστη της εφαρμογής σας, εξετάστε το ενδεχόμενο να έχετε ένα αρχικό έργο, αρχικά, αυτό θα σας δώσει χρόνο να εστιάσετε στην εκμάθηση του πλαισίου του Vision.

Ανοίξτε το αρχικό σας έργο. Οι προβολές στο σενάριο θα πρέπει να είναι έτοιμες και ρυθμισμένες για εσάς.

Στο  ViewController.swift,  αναζητήστε την ενότητα κώδικα με λειτουργίες και εξόδους.

Κάτω από την έξοδο - ImageView, δηλώστε μια συνεδρία για  AVcapturesession  - αυτό χρησιμοποιείται όποτε θέλετε να εκτελούνται ενέργειες με βάση μια ζωντανή ροή.

Ρυθμίστε το  AVcapturesession  και το  AVmediatype  σε βίντεο, αφού θα εκτελέσετε τη λήψη της κάμερας για να μπορείτε να εκτελείται συνεχώς

Καθορίστε τη συσκευή εξόδου και εισόδου

Η είσοδος είναι αυτό που θα δει η κάμερα και η έξοδος είναι το βίντεο σε μια καθορισμένη μορφή τύπου KCVPixelFormatType_32GRA.

Τέλος, προσθέστε ένα  υποστρώμα  που περιέχει βίντεο στο  imageView  και ξεκινήστε τη συνεδρία. Η συνάρτηση είναι γνωστή ως  inViewdidload.  Πρέπει επίσης να ρυθμίσετε το πλαίσιο του στρώματος.

Καλέστε τη συνάρτηση στη   μέθοδο viewWillAppear .

Καθώς τα όρια δεν έχουν ακόμη οριστικοποιηθεί, παρακάμψτε τη  μέθοδο viewDidLayoutSubviews ( )  για να ενημερώσετε τα δεσμευμένα επίπεδα.

Μετά την κυκλοφορία του iOS 10, απαιτείται μια πρόσθετη καταχώριση στο Info.plist, κάτι που παρέχει έναν λόγο για τη χρήση της κάμερας. Θα πρέπει επίσης να ορίσετε Privacy-Camera Usage Description.

Ανίχνευση κειμένου; Πώς λειτουργεί το Vision Framework

Υπάρχουν τρία βήματα για την εφαρμογή του Vision στην εφαρμογή.

Handlers –  αυτό συμβαίνει όταν θέλετε το πλαίσιο να κάνει κάτι μετά την κλήση του αιτήματος.

Παρατηρήσεις –  αυτό είναι που θέλετε να κάνετε με τα δεδομένα που παρέχετε ξεκινώντας με ένα αίτημα

Αιτήματα -  αυτό συμβαίνει όταν ζητάτε πλαίσιο ανίχνευσης

Στην ιδανική περίπτωση, δημιουργείτε ένα αίτημα κειμένου ως  VNdetecttextrectanglesrequest . Αυτό είναι ένα είδος  VN request  που περιορίζεται γύρω από το κείμενο. Αφού το πλαίσιο ολοκληρώσει την εφαρμογή, προχωράτε στην κλήση της   συνάρτησης Detexthandler . Θα θέλετε επίσης να μάθετε το ακριβές πλαίσιο που αναγνωρίστηκε, ορίστε το σε  Reportcharacterboxes =True.

Μετά από αυτό, ορίστε τις παρατηρήσεις που περιέχουν όλα τα αποτελέσματα του  VNdetecttextrectanglesrequest , θυμηθείτε να προσθέσετε το Vision στην κάμερα εξόδου. Εφόσον το Vision εκθέτει API υψηλού επιπέδου, η εργασία με αυτό είναι ασφαλής.

Η συνάρτηση ελέγχει εάν  υπάρχει το  Cmsamplebuffer και η έξοδος  PutOut Avcapture . Στη συνέχεια, θα πρέπει να προχωρήσετε στη δημιουργία μιας μεταβλητής  Requestoptions  ως 1 Τύπος λεξικού  VNimageoption . Η   επιλογή VNmage είναι ένας τύπος δομής που περιέχει ιδιότητες και δεδομένα από την κάμερα. Στη συνέχεια, θα πρέπει να δημιουργήσετε το  VNimagerequesthandler  και να εκτελέσετε το αίτημα κειμένου.

Εντοπίστηκε σχεδίαση περιγραμμάτων γύρω από το κείμενο

Μπορείτε να ξεκινήσετε έχοντας το πλαίσιο για να σχεδιάσετε δύο πλαίσια, ένα για κάθε γράμμα που εντοπίζει και το άλλο για κάθε λέξη. Οι πίνακες είναι ο συνδυασμός όλων των πλαισίων χαρακτήρων που θα βρει το αίτημά σας.

  • Καθορίστε τα σημεία στην άποψή σας για να σας βοηθήσουν να τοποθετήσετε τα πλαίσια.
  • Μετά από αυτό, δημιουργήστε ένα  CALaye r. χρησιμοποιήστε την  παρατήρηση VNrectangle  για να ορίσετε τους περιορισμούς σας, διευκολύνοντας τη διαδικασία σύνταξης του πλαισίου.

Τώρα έχετε διαμορφώσει όλες τις λειτουργίες σας.

Για να συνδέσετε τις τελείες σας, ξεκινήστε με την ασύγχρονη εκτέλεση του κωδικού σας. Στη συνέχεια, θα πρέπει να ελέγξετε εάν υπάρχει μια περιοχή στα αποτελέσματά σας από το  VNTextObservation .

Τώρα μπορείτε να καλέσετε τη συνάρτησή σας, η οποία θα σχεδιάσει ένα πλαίσιο εντός της περιοχής. Ελέγξτε για να δείτε αν υπάρχουν πλαίσια χαρακτήρων εντός της περιοχής και, στη συνέχεια, καλέστε την υπηρεσία που φέρνει ένα πλαίσιο γύρω από κάθε γράμμα.

Μετά από αυτό, δημιουργήστε μια μεταβλητή  RequestOptions. Τώρα μπορείτε να δημιουργήσετε ένα  αντικείμενο VNImageRequestHandler  και να εκτελέσετε το αίτημα κειμένου που δημιουργήσατε.

Τέλος, το τελευταίο βήμα είναι να εκτελέσετε τον κωδικό όρασής σας με τη ζωντανή ροή. Θα χρειαστεί να πάρετε την έξοδο βίντεο και να το μετατρέψετε σε  Cmsamplebuffer.

Πρόσθετες Συμβουλές

Προσπαθήστε πάντα να περικόψετε την εικόνα και να επεξεργάζεστε μόνο την ενότητα που χρειάζεστε. Αυτό θα μειώσει τον χρόνο επεξεργασίας και το αποτύπωμα μνήμης

Ενεργοποιήστε τη διόρθωση γλώσσας όταν ασχολείστε με μη αριθμητικούς χαρακτήρες και, στη συνέχεια, απενεργοποιήστε τη όταν έχετε να κάνετε με έναν αριθμητικό χαρακτήρα

Συμπεριλάβετε επικύρωση για αναγνωρισμένες συμβολοσειρές αριθμών για να επιβεβαιώσετε την ακρίβεια και να εξαλείψετε την εμφάνιση ψευδούς τιμής στον χρήστη.

Ο ελεγκτής κάμερας εγγράφων είναι ο καλύτερος σύντροφος για την αναγνώριση κειμένου, καθώς η ποιότητα της εικόνας παίζει σημαντικό ρόλο στην αναγνώριση κειμένου.

Εξετάστε το ενδεχόμενο να ορίσετε ένα ελάχιστο ύψος κειμένου για να αυξήσετε την απόδοση.

Με το Vision, έχετε όλα όσα χρειάζεστε για την αναγνώριση κειμένου. Δεδομένου ότι το Vision είναι εύκολο στη χρήση και απαιτεί λίγο χρόνο για την εφαρμογή του, η χρήση του είναι σχεδόν ισοδύναμη με το παιχνίδι με Lego. Δοκιμάστε να δοκιμάσετε την εφαρμογή σας σε διαφορετικά αντικείμενα, γραμματοσειρές, φωτισμό και μεγέθη. Μπορείτε επίσης να εντυπωσιάσετε τον εαυτό σας συνδυάζοντας το Vision με το Core ML.


Leave a Comment

Πώς να βρείτε αναπάντητες κλήσεις από άγνωστους αριθμούς στο iPhone

Πώς να βρείτε αναπάντητες κλήσεις από άγνωστους αριθμούς στο iPhone

Μετά την ενημέρωση του iPhone σε iOS 26, οι αναπάντητες κλήσεις από άγνωστους αριθμούς δεν εμφανίζονται στην ενότητα Κλήσεις ή Πρόσφατες κλήσεις της εφαρμογής Τηλέφωνο.

Πώς να ενεργοποιήσετε το NFC στο iPhone εύκολα και γρήγορα

Πώς να ενεργοποιήσετε το NFC στο iPhone εύκολα και γρήγορα

Η Επικοινωνία Εγγύς Πεδίου είναι μια ασύρματη τεχνολογία που επιτρέπει σε συσκευές να ανταλλάσσουν δεδομένα όταν βρίσκονται σε κοντινή απόσταση μεταξύ τους, συνήθως σε απόσταση λίγων εκατοστών.

Mẹo mở ảnh mới nhất trên iPhone cực nhanh

Mẹo mở ảnh mới nhất trên iPhone cực nhanh

Việc nhấn và giữ ứng dụng biểu tượng trên iPhone sẽ cung cấp cho bạn nhiều tùy chọn hơn. Dưới đây là thủ thuật mở ảnh gần đây nhất trên iPhone.

6 εφαρμογές για iPhone που κάνουν τα widgets πραγματικά χρήσιμα

6 εφαρμογές για iPhone που κάνουν τα widgets πραγματικά χρήσιμα

Τα widgets υποτίθεται ότι κάνουν το iPhone πιο χρήσιμο, αλλά τα περισσότερα δεν ανταποκρίνονται στις δυνατότητές τους. Ωστόσο, μερικές εφαρμογές μπορούν επιτέλους να κάνουν τα widgets να αξίζουν τον χρόνο σας.

Πώς να κάνετε αυτόματη απάντηση στο Mail στο iPhone

Πώς να κάνετε αυτόματη απάντηση στο Mail στο iPhone

Μπορείτε να χρησιμοποιήσετε την εφαρμογή Mail για να ρυθμίσετε ένα μήνυμα απάντησης "εκτός γραφείου" όταν δεν χρησιμοποιείτε συχνά το Mail στο iPhone σας ή να ρυθμίσετε ένα αυτόματο μήνυμα στο iCloud Mail.

Γρήγορες συμβουλές για να ελέγξετε την ασφάλεια του WiFi στο iPhone κατά τη σύνδεση

Γρήγορες συμβουλές για να ελέγξετε την ασφάλεια του WiFi στο iPhone κατά τη σύνδεση

Η Apple διευκολύνει τον έλεγχο ασφάλειας ενός δικτύου WiFi πριν από τη σύνδεσή σας. Δεν χρειάζεστε κανένα λογισμικό ή άλλα εργαλεία για να σας βοηθήσουν, απλώς χρησιμοποιήστε τις ενσωματωμένες ρυθμίσεις στο iPhone σας.

Πώς να διορθώσετε το σφάλμα Το Apple CarPlay δεν λειτουργεί

Πώς να διορθώσετε το σφάλμα Το Apple CarPlay δεν λειτουργεί

Υπάρχουν πολλοί λόγοι για τους οποίους το Apple CarPlay ενδέχεται να μην λειτουργεί, να σταματήσει να λειτουργεί ή να μην λειτουργεί σωστά.

Πώς να ορίσετε μια ταπετσαρία που αποκαλύπτει το πρόσωπο στο iOS 16 για να «ακολουθήσετε την τάση»

Πώς να ορίσετε μια ταπετσαρία που αποκαλύπτει το πρόσωπο στο iOS 16 για να «ακολουθήσετε την τάση»

Μόλις ενημερώσετε το iPhone σας στην επίσημη έκδοση iOS 16, θα μπορείτε να ορίσετε μια ταπετσαρία iPhone χωρίς να καλύπτετε το πρόσωπό σας κατά την προσαρμογή της ταπετσαρίας σύμφωνα με το εφέ βάθους.

Πώς να αποκλείσετε κάποιον από το να αλλάξει τις προτάσεις σας για μουσική της Apple

Πώς να αποκλείσετε κάποιον από το να αλλάξει τις προτάσεις σας για μουσική της Apple

Εάν κάποιος άλλος παίζει Apple Music χρησιμοποιώντας τον λογαριασμό σας σε πολλές συσκευές, αυτές οι προτάσεις ενδέχεται να περιλαμβάνουν τραγούδια που δεν σας αρέσουν.

Πώς να μετατρέψετε φωτογραφίες σε PDF στο iPhone είναι εξαιρετικά απλό

Πώς να μετατρέψετε φωτογραφίες σε PDF στο iPhone είναι εξαιρετικά απλό

Για να μετατρέψετε φωτογραφίες σε PDF στο iPhone, μπορείτε να χρησιμοποιήσετε πολλούς διαφορετικούς τρόπους. Η μετατροπή φωτογραφιών σε PDF θα μας βοηθήσει να λάβουμε ολοκληρωμένα αρχεία PDF από αρχεία εικόνας εγγράφων.