iPhone: Jak používat funkce detekce textu iOS

iPhone: Jak používat funkce detekce textu iOS

Vision v iOS 11 má vše, co potřebujete k vytvoření aplikace, která dokáže rozpoznat textové znaky, přičemž implementace probíhá současně. Nepotřebujete technické znalosti kódování – navigace ve funkci je poměrně jednoduchá. Implementace je navíc bezproblémová.

Vision Framework

Rámec vize vám umožňuje snadno implementovat jakýkoli úkol, který zahrnuje detaily počítače. Struktura provádí detekci obličeje a orientačních bodů obličeje, rozpoznávání čárových kódů, registraci obrazu, sledování obecných funkcí a detekci textu. Vision vám také umožňuje používat vlastní modely Core ML pro úkoly, jako je klasifikace nebo detekce objektů.

VN DetectTextRectanglesRequest

VN DetectTextRectanglesRequest  je požadavek analýza obrazu, který vyhledává oblasti viditelného textu v obraze; tato funkce vrací textové znaky jako obdélníkový ohraničovací rámeček s počátkem a velikostí.

Pokud jste zvyklí používat swift a nějakou dobu programujete, pak vás pravděpodobně zajímá, k čemu je Vision, když jsou k dispozici další funkce jako image a AVFoundation. No, Vision je přesnější a přímočařejší. Tato funkce je také dostupná na různých platformách. Použití Vision však může vyžadovat vyšší výpočetní výkon a dobu zpracování.

Chcete-li používat Vision pro detekci textu, budete potřebovat Xcode 9 a zařízení se systémem iOS 11.

Vytvoření fotoaparátu s Avcapture

Nejprve musíte vytvořit kameru s  AVCapture ; je to inicializací jednoho objektu AVcapturesession pro provádění zachycení v reálném čase nebo offline. Poté proveďte relaci k připojení zařízení.

Chcete-li ušetřit čas při vytváření uživatelského rozhraní vaší aplikace, zvažte vytvoření počátečního projektu, který vám dá čas soustředit se na učení rámce Vision.

Otevřete svůj startovací projekt. Všechny pohledy ve scénáři by pro vás měly být připraveny a nastaveny.

Na  ViewController.swift  vyhledejte sekci kódu s funkcemi a výstupy.

V zásuvce ImageView deklarujte relaci pro  AVcapturesession  – to se používá, kdykoli chcete, aby byly akce prováděny na základě živého streamu.

Nastavte  AVcapturesession  a  AVmediatype  na video, protože budete fotografovat kamerou, abyste umožnili jeho nepřetržitý provoz

Definujte výstupní a vstupní zařízení

Vstupem je to, co kamera uvidí, a výstupem je video v nastaveném formátu typu KCVPixelFormatType_32GRA.

Nakonec přidejte   do imageView  podvrstvu obsahující videa  a spusťte relaci. Funkce je známá jako  inViewdidload.  Musíte také nastavit rámec vrstvy.

Volejte funkci v   metodě viewWillAppear .

Protože hranice ještě nejsou dokončeny,  přepište metodu viewDidLayoutSubviews ( )  a aktualizujte vázané vrstvy.

Po vydání iOS 10 je potřeba další položka v Info.plist, což poskytuje důvod pro použití fotoaparátu. Měli byste také nastavit Popis použití soukromé kamery.

Detekce textu; Jak funguje Vision Framework

Implementace Vision do aplikace má tři kroky.

Obslužné nástroje –  to je, když chcete, aby framework něco provedl po zavolání požadavku.

Pozorování –  to je to, co chcete dělat s vámi dodanými údaji počínaje jednou žádostí

Požadavky –  to je, když požádáte o Detect framework

V ideálním případě vytvoříte jeden textový požadavek jako  VNdetecttextrectanglesrequest . Toto je druh požadavku  VN,  který ohraničuje text. Poté, co framework dokončí aplikaci, přistoupíte k volání funkce  Dettexthandler  . Budete také chtít znát přesný rámec, který byl rozpoznán, nastavte jej na  Reportcharacterboxes =True.

Poté definujte pozorování, která obsahují všechny výsledky požadavku  VNdetecttextrectanglesrequest , nezapomeňte přidat Vision do výstupní kamery. Vzhledem k tomu, že Vision odhaluje API na vysoké úrovni, práce s ním je bezpečná.

Kontroly funkce v případě, že  Cmsamplebuffer  existuje a putout  Avcaptureoutput . Pak byste měli přistoupit k vytvoření jedné proměnné  Requestoptions  jako 1 Dictionary Type  VNimageoption . Možnost  VNmage  je typ struktury, která obsahuje vlastnosti a data z kamery. Poté byste měli vytvořit  VNimagerequesthandler  a provést textový požadavek.

Kreslení ohraničení kolem textu zjištěno

Můžete začít tím, že rámeček nakreslí dvě pole, jedno pro každé písmeno, které zjistí, a druhé pro každé slovo. Tabulky jsou kombinací všech polí znaků, které váš požadavek najde.

  • Definujte body v pohledu, které vám pomohou umístit rámečky.
  • Poté vytvořte  CALaye r; pomocí  VNrectangleobservation  definujte svá omezení, čímž si usnadníte proces nastínění rámečku.

Nyní máte připraveny všechny funkce.

Chcete-li spojit své body, začněte tím, že váš kód bude spouštět asynchronně. Poté byste měli zkontrolovat, zda ve vašich výsledcích z VNTextObservation existuje oblast  .

Nyní můžete zavolat svou funkci, která nakreslí rámeček v oblasti. Zkontrolujte, zda jsou v dané oblasti pole znaků, a poté zavolejte službu, která každé písmeno vloží do rámečku.

Poté vytvořte proměnnou  RequestOptions. Nyní můžete vytvořit  objekt VNImageRequestHandler  a provést textový požadavek, který jste vytvořili.

Konečně posledním krokem je spuštění kódu vaší vize s živým přenosem. Budete muset vzít video výstup a převést jej na  Cmsamplebuffer.

Další tipy

Vždy se snažte obrázek oříznout a zpracovat pouze tu část, kterou potřebujete. Tím se sníží doba zpracování a nároky na paměť

Zapněte jazykovou korekci při práci s nečíselnými znaky a poté ji vypněte při práci s číselnými znaky

Zahrňte ověření rozpoznaných číselných řetězců, abyste potvrdili přesnost a odstranili zobrazení falešné hodnoty uživateli.

Ovladač dokumentové kamery je nejlepším společníkem pro rozpoznávání textu, protože kvalita obrazu hraje významnou roli při rozpoznávání textu.

Pro zvýšení výkonu zvažte nastavení minimální výšky textu.

S Vision máte vše, co potřebujete pro rozpoznávání textu. Vzhledem k tomu, že se Vision snadno používá a jeho implementace trvá krátkou dobu, je jeho použití téměř ekvivalentní hraní s Legem. Zkuste aplikaci otestovat na různých objektech, písmech, osvětlení a velikostech. Zapůsobit na sebe můžete také kombinací Vision s Core ML.


Kdy Apple vydá IOS 17.4?

Kdy Apple vydá IOS 17.4?

Stabilní aktualizace iOS 17.4 je za rohem a přináší několik významných změn. Apple s vydáním již několik týdnů beta testuje OS

Microsoft konečně zavádí Cortanu pro IOS a Android ve Velké Británii

Microsoft konečně zavádí Cortanu pro IOS a Android ve Velké Británii

Microsoft konečně přináší svou digitální asistentku Cortanu pro Android a iOS ve Velké Británii. Vydání, které přichází asi rok po podobném zavedení

Oprava záznamu obrazovky se nepodařilo uložit kvůli 5823

Oprava záznamu obrazovky se nepodařilo uložit kvůli 5823

Kód chyby 5823 je specifický pro zařízení iPhone a iPad. Dochází k tomu, když se uživatelé snaží uložit záznam obrazovky.

Mapy Google: Jak umístit pin na mapě

Mapy Google: Jak umístit pin na mapě

Rychlým umístěním špendlíku do Map Google získáte přesnou polohu, kterou můžete sdílet s přáteli. Podívejte se, jak umístit špendlík Map Google na iPadOS 14, Android a Desktop.

Oprava aplikace Signal nefunguje na iPhone

Oprava aplikace Signal nefunguje na iPhone

Pokud nemůžete používat Signal na iOS, zkontrolujte aktualizace aplikací a iOS. Poté upravte oprávnění aplikace, deaktivujte režim nízké spotřeby a znovu aplikaci nainstalujte.

IPhone: Jak přidat podpis do textových zpráv

IPhone: Jak přidat podpis do textových zpráv

Pěkné řešení pro přidávání podpisů do textových zpráv na vašem Apple iPhone.

Oprava: Nelze smazat nevyžádanou poštu na iPhone

Oprava: Nelze smazat nevyžádanou poštu na iPhone

Pokud vlastníte iPhone a máte potíže s mazáním nevyžádané pošty, aktualizujte své zařízení. Poté odstraňte e-maily z koše ze serveru.

9 nejlepších aplikací počasí pro iPad v roce 2023

9 nejlepších aplikací počasí pro iPad v roce 2023

Chcete mít na svém mobilním zařízení nejnovější informace o počasí? Získejte nejlepší aplikaci počasí pro iPad z tohoto seznamu. V dnešní době se počasí umoudřilo

13 nejlepších aplikací pro kódování pro iPad pro vývoj a učení funkčních aplikací

13 nejlepších aplikací pro kódování pro iPad pro vývoj a učení funkčních aplikací

Potřebujete kódovat na cestách do práce nebo si chcete oprášit své kódovací dovednosti? Můžete se podívat na tyto nejlepší kódovací aplikace pro iPad.

Oprava: Dropbox nenachází nové fotografie na iPhone

Oprava: Dropbox nenachází nové fotografie na iPhone

Pokud Dropbox nemůže najít a nahrát nové fotografie z vašeho iPhone, ujistěte se, že používáte nejnovější verze aplikací pro iOS a Dropbox.