iPhone: Kako uporabljati funkcije za zaznavanje besedila iOS

Vision v iOS 11 ima vse, kar potrebujete za ustvarjanje aplikacije, ki lahko prepozna besedilne znake, pri čemer se implementacija izvaja hkrati. Ne potrebujete tehničnega znanja o kodiranju – krmarjenje po funkciji je precej preprosto. Še več, izvedba je brezhibna.

Okvir vizije

Okvir vizije vam omogoča enostavno izvajanje katere koli naloge, ki vključuje računalniške podrobnosti. Struktura izvaja zaznavanje obrazov in mejnikov obraza, prepoznavanje črtne kode, registracijo slik, sledenje splošnim funkcijam in zaznavanje besedila. Vision vam omogoča tudi uporabo modelov Core ML po meri za naloge, kot sta razvrščanje ali odkrivanje predmetov.

VN DetectTextRectanglesRequest

VN DetectTextRectanglesRequest  je zahteva za analizo slike, ki najde regije vidnega besedila v sliki; funkcija vrne besedilne znake kot pravokotno omejevalno polje z izvorom in velikostjo.

Če ste navajeni uporabljati swift in že nekaj časa programirate, se verjetno sprašujete, kakšna je uporaba Visiona, če obstajajo druge funkcije, kot sta slika in AVFoundation. No, Vision je natančnejši in bolj preprost. Funkcija je na voljo tudi na različnih platformah. Vendar pa lahko uporaba Vision zahteva več procesorske moči in časa obdelave.

Če želite uporabljati Vision za zaznavanje besedila, potrebujete Xcode 9 in napravo z operacijskim sistemom iOS 11.

Ustvarjanje kamere z Avcapture

Najprej morate ustvariti kamero z  AVCapture ; to je tako, da se en objekt AVcapturesession inicializira za zajem v realnem času ali brez povezave. Po tem vzpostavite sejo do povezave naprave.

Da bi vam prihranili čas pri izdelavi uporabniškega vmesnika vaše aplikacije, razmislite o začetnem projektu, saj vam bo to dalo čas, da se osredotočite na učenje ogrodja Vision.

Odprite svoj začetni projekt. Pogledi v snemalni plošči bi morali biti pripravljeni in nastavljeni za vas.

Na  ViewController.swift  poiščite razdelek s kodo s funkcijami in vtičnicami.

Pod outlet- ImageView, d eClare sejo za  AVcapturesession  - ta se uporablja, kadar želite ukrepov, izvedenih na podlagi živo.

Nastavite  AVcapturesession  in  AVmediatype  na video, saj boste izvedli snemanje s kamero, da omogočite neprekinjeno delovanje

Določite izhodno in vhodno napravo

Vhod je tisto, kar bo videla kamera, izhod pa je video v formatu nastavljenega tipa KCVPixelFormatType_32GRA.

Nazadnje dodajte  podsloj,  ki vsebuje videoposnetke, v  imageView  in začnite sejo. Funkcija je znana kot  inViewdidload.  Prav tako morate nastaviti okvir plasti.

Pokličite funkcijo v   metodi viewWillAppear .

Ker meje še niso dokončane, preglasite  metodo viewDidLayoutSubviews ( ),  da posodobite vezane plasti.

Po izdaji iOS 10 je potreben dodaten vnos v Info.plist, kar je razlog za uporabo kamere. Nastavite tudi opis uporabe zasebnosti-kamere.

zaznavanje besedila; Kako deluje Vision Framework

Obstajajo trije koraki za implementacijo Visiona v aplikaciji.

Upravljavci –  to je, ko želite, da okvir naredi nekaj po klicu zahteve.

Opažanja –  to je tisto, kar želite narediti s podatki, ki ste jih posredovali, začenši z eno zahtevo

Zahteve –  to je, ko zahtevate okvir Detect

V idealnem primeru ustvarite eno besedilno zahtevo kot  VNdetecttextrectanglesrequest . To je neke vrste  VNrequest,  ki meji okoli besedila. Ko okvir dokonča aplikacijo, nadaljujete s klicem   funkcije Dettexthandler . Prav tako boste želeli izvedeti natančen okvir, ki je bil prepoznan, nastavite ga na  Reportcharacterboxes =True.

Po tem definirajte opazovanja, ki vsebujejo vse rezultate  VNdetecttextrectanglesrequest , ne pozabite dodati Vision v izhodno kamero. Ker Vision razkriva API-je na visoki ravni, je delo z njim varno.

Funkcija preveri, ali  Cmsamplebuffer  obstaja in PutOut  Avcaptureoutput . Nato morate nadaljevati z ustvarjanjem ene spremenljivke  Requeststoptions  kot 1 VNimageoption tipa  slovarja . Možnost  VNmage  je vrsta strukture, ki vsebuje lastnosti in podatke iz kamere. Nato morate ustvariti  VNimagerequesthandler  in izvesti besedilno zahtevo.

Risanje meja okoli zaznanega besedila

Začnete lahko tako, da imate okvir za risanje dveh polj, enega za vsako črko, ki jo zazna, in drugega za vsako besedo. Tabele so kombinacija vseh znakovnih polj, ki jih bo našla vaša zahteva.

  • Določite točke na svojem pogledu, ki vam bodo pomagale postaviti polja.
  • Po tem ustvarite  CALaye r; uporabite  VNrectangleobservation,  da določite svoje omejitve, kar olajša postopek orisa polja.

Zdaj imate vse svoje funkcije postavljene.

Če želite povezati svoje pike, začnite z asinhronim izvajanjem kode. Nato preverite, ali obstaja regija v vaših rezultatih iz vašega  VNTextObservation .

Zdaj lahko pokličete svojo funkcijo, ki bo narisala okvir znotraj območja. Preverite, ali so v regiji polja z znaki, nato pokličite storitev, ki prinese polje okoli vsake črke.

Po tem ustvarite spremenljivko  RequestOptions. Zdaj lahko ustvarite  objekt VNImageRequestHandler  in izvedete besedilno zahtevo, ki ste jo ustvarili.

Končno, zadnji korak je zagon vaše kode vizije s pretočnim predvajanjem v živo. Morali boste vzeti video izhod in ga pretvoriti v  Cmsamplebuffer.

Dodatni nasveti

Vedno poskusite obrezati sliko in obdelati samo odsek, ki ga potrebujete. To bo zmanjšalo čas obdelave in pomnilniški odtis

Vklopite popravek jezika, ko delate z neštevilskimi znaki, in ga izklopite, ko delate s številskim znakom

Vključite preverjanje prepoznanih številskih nizov, da potrdite točnost in odpravite prikazovanje napačne vrednosti uporabniku.

Krmilnik dokumentne kamere je najboljši spremljevalec za prepoznavanje besedila, saj ima kakovost slike pomembno vlogo pri prepoznavanju besedila.

Razmislite o nastavitvi minimalne višine besedila, da povečate učinkovitost.

Z Visionom imate vse, kar potrebujete za prepoznavanje besedila. Ker je Vision enostaven za uporabo in traja kratek čas za izvedbo, je njegova uporaba skoraj enakovredna igranju z Legos. Poskusite preizkusiti svojo aplikacijo na različnih predmetih, pisavah, osvetlitvi in ​​velikostih. Navdušite se lahko tudi s kombinacijo Visiona in Core ML.


Leave a Comment

9 nastavitev zasebnosti za iPhone, ki jih morate takoj vklopiti

9 nastavitev zasebnosti za iPhone, ki jih morate takoj vklopiti

Apple se na področju zasebnosti znajde bolje kot večina podjetij. Vendar pa niso vse privzete nastavitve na iPhonu v najboljšem interesu uporabnika.

Kako odpreti ChatGPT z akcijskim gumbom na iPhoneu

Kako odpreti ChatGPT z akcijskim gumbom na iPhoneu

S tem akcijskim gumbom lahko kadar koli pokličete ChatGPT na svojem telefonu. Tukaj je vodnik za odpiranje ChatGPT z akcijskim gumbom na iPhonu.

Kako narediti dolge posnetke zaslona na iPhonu, narediti drsne posnetke zaslona na iPhonu

Kako narediti dolge posnetke zaslona na iPhonu, narediti drsne posnetke zaslona na iPhonu

Kako narediti dolg posnetek zaslona na iPhonu, lahko enostavno zajamete celotno spletno stran. Funkcija pomikanja po zaslonu na iPhonu je na voljo v sistemih iOS 13 in iOS 14, tukaj pa je podroben vodnik o tem, kako narediti dolg posnetek zaslona na iPhonu.

Navodila za spremembo gesla za iCloud so zelo preprosta

Navodila za spremembo gesla za iCloud so zelo preprosta

Geslo za iCloud lahko spremenite na več različnih načinov. Geslo za iCloud lahko spremenite v računalniku ali telefonu prek aplikacije za podporo.

Navodila za pridružitev deljenim albumom na iPhonu

Navodila za pridružitev deljenim albumom na iPhonu

Ko pošljete skupni album na iPhone nekomu drugemu, se mora ta oseba strinjati, da se mu pridruži. Povabila za skupno rabo albuma na iPhoneu lahko sprejmete na več načinov, kot je prikazano spodaj.

Kako najti izgubljene AirPods

Kako najti izgubljene AirPods

Ker so AirPods majhne in lahke, jih je včasih enostavno izgubiti. Dobra novica je, da preden začnete razstavljati hišo in iskati izgubljene slušalke, jih lahko izsledite s svojim iPhonom.

4 funkcije iPhona, ki v nekaterih državah ne delujejo

4 funkcije iPhona, ki v nekaterih državah ne delujejo

Ali ste vedeli, da se vaš iPhone lahko razlikuje od iPhonov, ki se prodajajo v drugih državah, odvisno od regije, kjer je izdelan?

Kako iskati slike z Google Images v telefonu

Kako iskati slike z Google Images v telefonu

Iskanje slik v obratni smeri na iPhoneu je zelo preprosto, če lahko uporabite brskalnik v napravi ali nekatere aplikacije tretjih oseb za več možnosti iskanja.

Navodila za vrtenje zaslona iPhona na vseh modelih

Navodila za vrtenje zaslona iPhona na vseh modelih

Z vodoravnim vrtenjem zaslona na iPhonu lahko gledate filme ali Netflix, si ogledujete PDF-je, igrate igre ... bolj priročno in imate boljšo izkušnjo.

Zakaj se baterija iPhona čez noč izprazni in kako to popraviti

Zakaj se baterija iPhona čez noč izprazni in kako to popraviti

Če ste se kdaj zbudili in ugotovili, da je baterija vašega iPhona nenadoma padla na 20 % ali manj, niste sami.