iPhone: kā izmantot iOS teksta noteikšanas funkcijas

Vision operētājsistēmā iOS 11 ir viss nepieciešamais, lai izveidotu lietotni, kas var atpazīt teksta rakstzīmes, un tās tiek ieviestas vienlaikus. Jums nav nepieciešamas tehniskās kodēšanas zināšanas – navigācija pa funkciju ir pavisam vienkārša. Turklāt ieviešana ir nemanāma.

Vīzijas ietvars

Vīzijas sistēma ļauj viegli īstenot jebkuru uzdevumu, kas saistīts ar datora detaļām. Struktūra veic sejas un sejas orientieru noteikšanu, svītrkoda atpazīšanu, attēlu reģistrāciju, vispārīgu funkciju izsekošanu un teksta noteikšanu. Vision arī ļauj izmantot pielāgotus Core ML modeļus tādiem uzdevumiem kā klasifikācija vai objektu noteikšana.

VN DetectTextRectanglesRequest

VN DetectTextRectanglesRequest  ir attēlu analīzes pieprasījumu, kas atrod reģioni redzamā teksta attēlu; līdzeklis atgriež teksta rakstzīmes kā taisnstūrveida ierobežojošo lodziņu ar izcelsmi un izmēru.

Ja esat pieradis izmantot swift un jau kādu laiku programmējat, tad, iespējams, rodas jautājums, kāda ir Vision izmantošana, ja ir arī citas funkcijas, piemēram, attēls un AVFoundation. Vision ir precīzāks un vienkāršāks. Šī funkcija ir pieejama arī dažādās platformās. Tomēr, izmantojot Vision, var būt nepieciešama lielāka apstrādes jauda un apstrādes laiks.

Lai teksta noteikšanai izmantotu Vision, jums būs nepieciešams Xcode 9 un ierīce, kurā darbojas operētājsistēma iOS 11.

Kameras izveide ar Avcapture

Pirmkārt, jums ir jāizveido kamera ar  AVCapture ; tas notiek, inicializējot viena objekta AVcapturesessiju, lai veiktu tveršanu reāllaikā vai bezsaistē. Pēc tam veiciet sesiju ar ierīces savienojumu.

Lai ietaupītu laiku no lietotnes lietotāja saskarnes izveides, apsveriet sākuma projektu, jo tas dos jums laiku koncentrēties uz Vision ietvara apguvi.

Atveriet sākuma projektu. Scenogrāfa skatiem ir jābūt gataviem un iestatītiem jums.

Vietnē  ViewController.swift  meklējiet koda sadaļu ar funkcijām un kontaktligzdām.

Sadaļā ImageView norādiet sesiju  AVcapturesession — tas tiek izmantots ikreiz, kad vēlaties veikt darbības, pamatojoties uz tiešraides straumi.

Iestatiet  AVcapturesession  un  AVmediatype  uz video, jo jūs veiksit kameru, lai tā darbotos nepārtraukti

Definējiet izvades un ievades ierīci

Ievade ir tāda, ko redzēs kamera, un izvade ir video iestatītā veida formātā KCVPixelFormatType_32GRA.

Visbeidzot pievienojiet  apakšslāni,  kurā ir videoklipi,  attēlam View  un sāciet sesiju. Funkcija ir pazīstama kā  inViewdidload.  Jums arī jāiestata slāņa rāmis.

Izsauciet funkciju  viewWillAppear  metodē.

Tā kā robežas vēl nav pabeigtas,  ignorējiet metodi viewDidLayoutSubviews ( ),  lai atjauninātu saistītos slāņus.

Pēc iOS 10 izlaišanas ir nepieciešams papildu ieraksts Info.plist, kas ir iemesls kameras lietošanai. Jums arī jāiestata Privātuma kameras lietošanas apraksts.

Teksta noteikšana; Kā darbojas Vision Framework

Vision ieviešanai lietotnē ir jāveic trīs darbības.

Apdarinātāji —  tas ir tad, kad vēlaties, lai sistēma kaut ko darītu pēc pieprasījuma izsaukšanas.

Novērojumi –  tas ir tas, ko vēlaties darīt ar jūsu sniegtajiem datiem, sākot ar vienu pieprasījumu

Pieprasījumi —  tas ir tad, kad jūs lūdzat Detect framework

Ideālā gadījumā jūs izveidojat vienu teksta pieprasījumu kā  VNdetecttextrectanglesrequest . Šis ir sava veida  VNpieprasījums,  kas robežojas ar tekstu. Kad sistēma ir pabeigusi lietojumprogrammu, varat izsaukt funkciju  Dettexthandler  . Vēlēsities arī uzzināt precīzu rāmi, kas tika atpazīts, iestatiet to uz  Reportcharacterboxes =True.

Pēc tam definējiet novērojumus, kas satur visus VNdetecttextrectanglesrequest rezultātus  , neaizmirstiet pievienot Vision izvades kamerai. Tā kā Vision atklāj augsta līmeņa API, darbs ar to ir drošs.

Funkciju pārbauda, ja  Cmsamplebuffer  pastāv un PutOut  Avcaptureoutput . Pēc tam jums vajadzētu turpināt izveidot vienu mainīgo  Requestoptions  kā 1 vārdnīcas tipa  VNimageoptionVNmage  variants ir tās struktūras veida, kas satur īpašumus un datus no kameras. Pēc tam jums vajadzētu izveidot  VNimagerequesthandler  un izpildīt teksta pieprasījumu.

Robežu zīmēšana ap atrasto tekstu

Varat sākt ar sistēmu, lai izveidotu divus lodziņus, vienu katram burtam un otru katram vārdam. Tabulas ir visu to rakstzīmju lodziņu kombinācija, kuras atradīs jūsu pieprasījums.

  • Nosakiet punktus savā skatā, lai palīdzētu novietot lodziņus.
  • Pēc tam izveidojiet  CALaye r; izmantojiet  VNrectangleobservation,  lai definētu savus ierobežojumus, atvieglojot lodziņa iezīmēšanas procesu.

Tagad jums ir noteiktas visas savas funkcijas.

Lai savienotu punktus, vispirms palaidiet kodu asinhroni. Pēc tam jums vajadzētu pārbaudīt, vai jūsu VNTextObservation rezultātos ir reģions  .

Tagad varat izsaukt savu funkciju, kas apgabalā iezīmēs lodziņu. Pārbaudiet, vai reģionā ir rakstzīmju kastes, un pēc tam izsauciet pakalpojumu, kas ap katru burtu ievieto lodziņu.

Pēc tam izveidojiet mainīgo  RequestOptions. Tagad varat izveidot  VNImageRequestHandler  objektu un izpildīt izveidoto teksta pieprasījumu.

Visbeidzot, pēdējais solis ir jūsu redzes koda palaišana tiešraides straumē. Jums būs jāņem video izvade un jāpārvērš tā par  Cmsamplebuffer.

Papildu padomi

Vienmēr mēģiniet apgriezt attēlu un apstrādāt tikai vajadzīgo sadaļu. Tas samazinās apstrādes laiku un atmiņas nospiedumu

Ieslēdziet valodas korekciju, strādājot ar rakstzīmēm, kas nav ciparu, un izslēdziet to, strādājot ar ciparu rakstzīmēm

Iekļaujiet atpazīto skaitļu virkņu validāciju, lai apstiprinātu precizitāti un novērstu nepatiesu vērtību rādīšanu lietotājam.

Dokumentu kameras kontrolleris ir labākais teksta atpazīšanas palīgs, jo attēla kvalitātei ir liela nozīme teksta atpazīšanā.

Apsveriet iespēju iestatīt minimālo teksta augstumu, lai palielinātu veiktspēju.

Izmantojot Vision, jums ir viss nepieciešamais teksta atpazīšanai. Tā kā Vision ir viegli lietojams un ieviešana aizņem īsu laiku, tā lietošana ir gandrīz līdzvērtīga spēlēšanai ar Lego. Mēģiniet pārbaudīt savu lietotni ar dažādiem objektiem, fontiem, apgaismojumu un izmēriem. Varat arī pārsteigt par sevi, apvienojot Vision ar Core ML.


Leave a Comment

9 iPhone privātuma iestatījumi, kas jums jāieslēdz tūlīt

9 iPhone privātuma iestatījumi, kas jums jāieslēdz tūlīt

Apple privātuma jomā darbojas labāk nekā vairums uzņēmumu. Taču ne visi iPhone noklusējuma iestatījumi ir lietotāja interesēs.

Kā atvērt ChatGPT ar darbības pogu iPhone tālrunī

Kā atvērt ChatGPT ar darbības pogu iPhone tālrunī

Izmantojot šo darbības pogu, varat jebkurā laikā piezvanīt uz ChatGPT savā tālrunī. Šeit ir sniegta pamācība, kā atvērt ChatGPT, izmantojot darbības pogu iPhone tālrunī.

Kā uzņemt garus ekrānuzņēmumus iPhone tālrunī, kā uzņemt ritināmus ekrānuzņēmumus iPhone tālrunī

Kā uzņemt garus ekrānuzņēmumus iPhone tālrunī, kā uzņemt ritināmus ekrānuzņēmumus iPhone tālrunī

Kā uzņemt garu ekrānuzņēmumu iPhone tālrunī, var viegli uzņemt visu tīmekļa lapu. Ritināmā ekrānuzņēmuma funkcija iPhone tālrunī ir pieejama operētājsistēmās iOS 13 un iOS 14, un šeit ir sniegta detalizēta pamācība par to, kā uzņemt garu ekrānuzņēmumu iPhone tālrunī.

Norādījumi iCloud paroles maiņai ir ļoti vienkārši.

Norādījumi iCloud paroles maiņai ir ļoti vienkārši.

Lai mainītu savu iCloud paroli, varat to izdarīt daudzos dažādos veidos. Jūs varat mainīt savu iCloud paroli savā datorā vai tālrunī, izmantojot atbalsta lietojumprogrammu.

Norādījumi par koplietoto albumu pievienošanu iPhone tālrunī

Norādījumi par koplietoto albumu pievienošanu iPhone tālrunī

Kad nosūtāt sadarbības albumu kādam citam no iPhone tālruņa, šai personai būs jāpiekrīt pievienoties. Ir vairāki veidi, kā pieņemt uzaicinājumus kopīgot albumu no iPhone tālruņa, kā parādīts tālāk.

Kā atrast pazaudētas AirPods austiņas

Kā atrast pazaudētas AirPods austiņas

Tā kā AirPods ir mazas un vieglas, tās dažreiz var viegli pazaudēt. Labā ziņa ir tā, ka pirms sākat izjaukt māju, meklējot pazudušās austiņas, varat tās izsekot, izmantojot savu iPhone.

4 iPhone funkcijas, kas nedarbojas dažās valstīs

4 iPhone funkcijas, kas nedarbojas dažās valstīs

Vai zinājāt, ka atkarībā no reģiona, kurā jūsu iPhone ir ražots, tam var būt atšķirības salīdzinājumā ar iPhone, kas tiek pārdoti citās valstīs?

Kā meklēt attēlus, izmantojot Google attēlus savā tālrunī

Kā meklēt attēlus, izmantojot Google attēlus savā tālrunī

Apgrieztā attēlu meklēšana iPhone tālrunī ir ļoti vienkārša, ja varat izmantot ierīces pārlūkprogrammu vai izmantot dažas trešo pušu lietojumprogrammas, lai iegūtu vairāk meklēšanas opciju.

Norādījumi iPhone ekrāna pagriešanai visos modeļos

Norādījumi iPhone ekrāna pagriešanai visos modeļos

Ekrāna horizontāla pagriešana iPhone tālrunī palīdz skatīties filmas vai Netflix, skatīt PDF failus, spēlēt spēles... ērtāk un iegūt labāku pieredzi.

Kāpēc iPhone akumulators izlādējas nakts laikā un kā to salabot

Kāpēc iPhone akumulators izlādējas nakts laikā un kā to salabot

Ja kādreiz esat pamodies un pēkšņi atklājis, ka jūsu iPhone akumulatora uzlādes līmenis ir samazinājies līdz 20% vai mazāk, jūs neesat viens.