iPhone: Jak používat funkce detekce textu iOS

Vision v iOS 11 má vše, co potřebujete k vytvoření aplikace, která dokáže rozpoznat textové znaky, přičemž implementace probíhá současně. Nepotřebujete technické znalosti kódování – navigace ve funkci je poměrně jednoduchá. Implementace je navíc bezproblémová.

Vision Framework

Rámec vize vám umožňuje snadno implementovat jakýkoli úkol, který zahrnuje detaily počítače. Struktura provádí detekci obličeje a orientačních bodů obličeje, rozpoznávání čárových kódů, registraci obrazu, sledování obecných funkcí a detekci textu. Vision vám také umožňuje používat vlastní modely Core ML pro úkoly, jako je klasifikace nebo detekce objektů.

VN DetectTextRectanglesRequest

VN DetectTextRectanglesRequest  je požadavek analýza obrazu, který vyhledává oblasti viditelného textu v obraze; tato funkce vrací textové znaky jako obdélníkový ohraničovací rámeček s počátkem a velikostí.

Pokud jste zvyklí používat swift a nějakou dobu programujete, pak vás pravděpodobně zajímá, k čemu je Vision, když jsou k dispozici další funkce jako image a AVFoundation. No, Vision je přesnější a přímočařejší. Tato funkce je také dostupná na různých platformách. Použití Vision však může vyžadovat vyšší výpočetní výkon a dobu zpracování.

Chcete-li používat Vision pro detekci textu, budete potřebovat Xcode 9 a zařízení se systémem iOS 11.

Vytvoření fotoaparátu s Avcapture

Nejprve musíte vytvořit kameru s  AVCapture ; je to inicializací jednoho objektu AVcapturesession pro provádění zachycení v reálném čase nebo offline. Poté proveďte relaci k připojení zařízení.

Chcete-li ušetřit čas při vytváření uživatelského rozhraní vaší aplikace, zvažte vytvoření počátečního projektu, který vám dá čas soustředit se na učení rámce Vision.

Otevřete svůj startovací projekt. Všechny pohledy ve scénáři by pro vás měly být připraveny a nastaveny.

Na  ViewController.swift  vyhledejte sekci kódu s funkcemi a výstupy.

V zásuvce ImageView deklarujte relaci pro  AVcapturesession  – to se používá, kdykoli chcete, aby byly akce prováděny na základě živého streamu.

Nastavte  AVcapturesession  a  AVmediatype  na video, protože budete fotografovat kamerou, abyste umožnili jeho nepřetržitý provoz

Definujte výstupní a vstupní zařízení

Vstupem je to, co kamera uvidí, a výstupem je video v nastaveném formátu typu KCVPixelFormatType_32GRA.

Nakonec přidejte   do imageView  podvrstvu obsahující videa  a spusťte relaci. Funkce je známá jako  inViewdidload.  Musíte také nastavit rámec vrstvy.

Volejte funkci v   metodě viewWillAppear .

Protože hranice ještě nejsou dokončeny,  přepište metodu viewDidLayoutSubviews ( )  a aktualizujte vázané vrstvy.

Po vydání iOS 10 je potřeba další položka v Info.plist, což poskytuje důvod pro použití fotoaparátu. Měli byste také nastavit Popis použití soukromé kamery.

Detekce textu; Jak funguje Vision Framework

Implementace Vision do aplikace má tři kroky.

Obslužné nástroje –  to je, když chcete, aby framework něco provedl po zavolání požadavku.

Pozorování –  to je to, co chcete dělat s vámi dodanými údaji počínaje jednou žádostí

Požadavky –  to je, když požádáte o Detect framework

V ideálním případě vytvoříte jeden textový požadavek jako  VNdetecttextrectanglesrequest . Toto je druh požadavku  VN,  který ohraničuje text. Poté, co framework dokončí aplikaci, přistoupíte k volání funkce  Dettexthandler  . Budete také chtít znát přesný rámec, který byl rozpoznán, nastavte jej na  Reportcharacterboxes =True.

Poté definujte pozorování, která obsahují všechny výsledky požadavku  VNdetecttextrectanglesrequest , nezapomeňte přidat Vision do výstupní kamery. Vzhledem k tomu, že Vision odhaluje API na vysoké úrovni, práce s ním je bezpečná.

Kontroly funkce v případě, že  Cmsamplebuffer  existuje a putout  Avcaptureoutput . Pak byste měli přistoupit k vytvoření jedné proměnné  Requestoptions  jako 1 Dictionary Type  VNimageoption . Možnost  VNmage  je typ struktury, která obsahuje vlastnosti a data z kamery. Poté byste měli vytvořit  VNimagerequesthandler  a provést textový požadavek.

Kreslení ohraničení kolem textu zjištěno

Můžete začít tím, že rámeček nakreslí dvě pole, jedno pro každé písmeno, které zjistí, a druhé pro každé slovo. Tabulky jsou kombinací všech polí znaků, které váš požadavek najde.

  • Definujte body v pohledu, které vám pomohou umístit rámečky.
  • Poté vytvořte  CALaye r; pomocí  VNrectangleobservation  definujte svá omezení, čímž si usnadníte proces nastínění rámečku.

Nyní máte připraveny všechny funkce.

Chcete-li spojit své body, začněte tím, že váš kód bude spouštět asynchronně. Poté byste měli zkontrolovat, zda ve vašich výsledcích z VNTextObservation existuje oblast  .

Nyní můžete zavolat svou funkci, která nakreslí rámeček v oblasti. Zkontrolujte, zda jsou v dané oblasti pole znaků, a poté zavolejte službu, která každé písmeno vloží do rámečku.

Poté vytvořte proměnnou  RequestOptions. Nyní můžete vytvořit  objekt VNImageRequestHandler  a provést textový požadavek, který jste vytvořili.

Konečně posledním krokem je spuštění kódu vaší vize s živým přenosem. Budete muset vzít video výstup a převést jej na  Cmsamplebuffer.

Další tipy

Vždy se snažte obrázek oříznout a zpracovat pouze tu část, kterou potřebujete. Tím se sníží doba zpracování a nároky na paměť

Zapněte jazykovou korekci při práci s nečíselnými znaky a poté ji vypněte při práci s číselnými znaky

Zahrňte ověření rozpoznaných číselných řetězců, abyste potvrdili přesnost a odstranili zobrazení falešné hodnoty uživateli.

Ovladač dokumentové kamery je nejlepším společníkem pro rozpoznávání textu, protože kvalita obrazu hraje významnou roli při rozpoznávání textu.

Pro zvýšení výkonu zvažte nastavení minimální výšky textu.

S Vision máte vše, co potřebujete pro rozpoznávání textu. Vzhledem k tomu, že se Vision snadno používá a jeho implementace trvá krátkou dobu, je jeho použití téměř ekvivalentní hraní s Legem. Zkuste aplikaci otestovat na různých objektech, písmech, osvětlení a velikostech. Zapůsobit na sebe můžete také kombinací Vision s Core ML.


Leave a Comment

9 nastavení soukromí na iPhonu, která byste měli hned zapnout

9 nastavení soukromí na iPhonu, která byste měli hned zapnout

Apple odvádí v oblasti soukromí lepší práci než většina společností. Ne všechna výchozí nastavení iPhonu jsou ale v nejlepším zájmu uživatele.

Jak otevřít ChatGPT pomocí akčního tlačítka na iPhone

Jak otevřít ChatGPT pomocí akčního tlačítka na iPhone

Pomocí tohoto akčního tlačítka můžete kdykoli na telefonu zavolat ChatGPT. Zde je návod, jak otevřít ChatGPT pomocí akčního tlačítka na iPhonu.

Jak pořizovat dlouhé snímky obrazovky na iPhonu, pořizovat rolovací snímky obrazovky na iPhonu

Jak pořizovat dlouhé snímky obrazovky na iPhonu, pořizovat rolovací snímky obrazovky na iPhonu

Jak pořídit dlouhý snímek obrazovky na iPhonu vám pomůže snadno zachytit celou webovou stránku. Funkce posouvání obrazovky na iPhonu je k dispozici v systémech iOS 13 a iOS 14 a zde je podrobný návod, jak pořídit dlouhý snímek obrazovky na iPhonu.

Návod na změnu hesla iCloud je velmi jednoduchý

Návod na změnu hesla iCloud je velmi jednoduchý

Heslo k iCloudu můžete změnit mnoha různými způsoby. Heslo k iCloudu můžete změnit v počítači nebo v telefonu prostřednictvím podpůrné aplikace.

Pokyny pro připojení ke sdíleným albům na iPhonu

Pokyny pro připojení ke sdíleným albům na iPhonu

Když pošlete společné album na iPhonu někomu jinému, bude muset daná osoba souhlasit s připojením. Existuje několik způsobů, jak přijmout pozvánky ke sdílení alba na iPhonu, jak je uvedeno níže.

Jak najít ztracené AirPody

Jak najít ztracené AirPody

Protože jsou AirPods malá a lehká, někdy se snadno ztratí. Dobrou zprávou je, že než začnete rozebírat dům a hledat ztracená sluchátka, můžete je sledovat pomocí iPhonu.

4 funkce iPhonu, které v některých zemích nefungují

4 funkce iPhonu, které v některých zemích nefungují

Věděli jste, že v závislosti na regionu, kde se váš iPhone vyrábí, se může lišit od iPhonů prodávaných v jiných zemích?

Jak vyhledávat obrázky pomocí Obrázků Google v telefonu

Jak vyhledávat obrázky pomocí Obrázků Google v telefonu

Zpětné vyhledávání obrázků na iPhonu je velmi jednoduché, když můžete použít prohlížeč v zařízení nebo některé aplikace třetích stran pro více možností vyhledávání.

Pokyny pro rychlé volání na iPhonu jsou velmi jednoduché

Pokyny pro rychlé volání na iPhonu jsou velmi jednoduché

Pokud potřebujete často někoho kontaktovat, můžete si na svém iPhonu nastavit rychlé volání pomocí několika jednoduchých kroků.

Pokyny pro otáčení obrazovky iPhonu na všech modelech

Pokyny pro otáčení obrazovky iPhonu na všech modelech

Otočení obrazovky v horizontální rovině na iPhonu vám pomůže pohodlněji sledovat filmy nebo Netflix, prohlížet PDF soubory, hrát hry atd. a mít lepší zážitek.