iPhone: Jak používat funkce detekce textu iOS

Vision v iOS 11 má vše, co potřebujete k vytvoření aplikace, která dokáže rozpoznat textové znaky, přičemž implementace probíhá současně. Nepotřebujete technické znalosti kódování – navigace ve funkci je poměrně jednoduchá. Implementace je navíc bezproblémová.

Vision Framework

Rámec vize vám umožňuje snadno implementovat jakýkoli úkol, který zahrnuje detaily počítače. Struktura provádí detekci obličeje a orientačních bodů obličeje, rozpoznávání čárových kódů, registraci obrazu, sledování obecných funkcí a detekci textu. Vision vám také umožňuje používat vlastní modely Core ML pro úkoly, jako je klasifikace nebo detekce objektů.

VN DetectTextRectanglesRequest

VN DetectTextRectanglesRequest  je požadavek analýza obrazu, který vyhledává oblasti viditelného textu v obraze; tato funkce vrací textové znaky jako obdélníkový ohraničovací rámeček s počátkem a velikostí.

Pokud jste zvyklí používat swift a nějakou dobu programujete, pak vás pravděpodobně zajímá, k čemu je Vision, když jsou k dispozici další funkce jako image a AVFoundation. No, Vision je přesnější a přímočařejší. Tato funkce je také dostupná na různých platformách. Použití Vision však může vyžadovat vyšší výpočetní výkon a dobu zpracování.

Chcete-li používat Vision pro detekci textu, budete potřebovat Xcode 9 a zařízení se systémem iOS 11.

Vytvoření fotoaparátu s Avcapture

Nejprve musíte vytvořit kameru s  AVCapture ; je to inicializací jednoho objektu AVcapturesession pro provádění zachycení v reálném čase nebo offline. Poté proveďte relaci k připojení zařízení.

Chcete-li ušetřit čas při vytváření uživatelského rozhraní vaší aplikace, zvažte vytvoření počátečního projektu, který vám dá čas soustředit se na učení rámce Vision.

Otevřete svůj startovací projekt. Všechny pohledy ve scénáři by pro vás měly být připraveny a nastaveny.

Na  ViewController.swift  vyhledejte sekci kódu s funkcemi a výstupy.

V zásuvce ImageView deklarujte relaci pro  AVcapturesession  – to se používá, kdykoli chcete, aby byly akce prováděny na základě živého streamu.

Nastavte  AVcapturesession  a  AVmediatype  na video, protože budete fotografovat kamerou, abyste umožnili jeho nepřetržitý provoz

Definujte výstupní a vstupní zařízení

Vstupem je to, co kamera uvidí, a výstupem je video v nastaveném formátu typu KCVPixelFormatType_32GRA.

Nakonec přidejte   do imageView  podvrstvu obsahující videa  a spusťte relaci. Funkce je známá jako  inViewdidload.  Musíte také nastavit rámec vrstvy.

Volejte funkci v   metodě viewWillAppear .

Protože hranice ještě nejsou dokončeny,  přepište metodu viewDidLayoutSubviews ( )  a aktualizujte vázané vrstvy.

Po vydání iOS 10 je potřeba další položka v Info.plist, což poskytuje důvod pro použití fotoaparátu. Měli byste také nastavit Popis použití soukromé kamery.

Detekce textu; Jak funguje Vision Framework

Implementace Vision do aplikace má tři kroky.

Obslužné nástroje –  to je, když chcete, aby framework něco provedl po zavolání požadavku.

Pozorování –  to je to, co chcete dělat s vámi dodanými údaji počínaje jednou žádostí

Požadavky –  to je, když požádáte o Detect framework

V ideálním případě vytvoříte jeden textový požadavek jako  VNdetecttextrectanglesrequest . Toto je druh požadavku  VN,  který ohraničuje text. Poté, co framework dokončí aplikaci, přistoupíte k volání funkce  Dettexthandler  . Budete také chtít znát přesný rámec, který byl rozpoznán, nastavte jej na  Reportcharacterboxes =True.

Poté definujte pozorování, která obsahují všechny výsledky požadavku  VNdetecttextrectanglesrequest , nezapomeňte přidat Vision do výstupní kamery. Vzhledem k tomu, že Vision odhaluje API na vysoké úrovni, práce s ním je bezpečná.

Kontroly funkce v případě, že  Cmsamplebuffer  existuje a putout  Avcaptureoutput . Pak byste měli přistoupit k vytvoření jedné proměnné  Requestoptions  jako 1 Dictionary Type  VNimageoption . Možnost  VNmage  je typ struktury, která obsahuje vlastnosti a data z kamery. Poté byste měli vytvořit  VNimagerequesthandler  a provést textový požadavek.

Kreslení ohraničení kolem textu zjištěno

Můžete začít tím, že rámeček nakreslí dvě pole, jedno pro každé písmeno, které zjistí, a druhé pro každé slovo. Tabulky jsou kombinací všech polí znaků, které váš požadavek najde.

  • Definujte body v pohledu, které vám pomohou umístit rámečky.
  • Poté vytvořte  CALaye r; pomocí  VNrectangleobservation  definujte svá omezení, čímž si usnadníte proces nastínění rámečku.

Nyní máte připraveny všechny funkce.

Chcete-li spojit své body, začněte tím, že váš kód bude spouštět asynchronně. Poté byste měli zkontrolovat, zda ve vašich výsledcích z VNTextObservation existuje oblast  .

Nyní můžete zavolat svou funkci, která nakreslí rámeček v oblasti. Zkontrolujte, zda jsou v dané oblasti pole znaků, a poté zavolejte službu, která každé písmeno vloží do rámečku.

Poté vytvořte proměnnou  RequestOptions. Nyní můžete vytvořit  objekt VNImageRequestHandler  a provést textový požadavek, který jste vytvořili.

Konečně posledním krokem je spuštění kódu vaší vize s živým přenosem. Budete muset vzít video výstup a převést jej na  Cmsamplebuffer.

Další tipy

Vždy se snažte obrázek oříznout a zpracovat pouze tu část, kterou potřebujete. Tím se sníží doba zpracování a nároky na paměť

Zapněte jazykovou korekci při práci s nečíselnými znaky a poté ji vypněte při práci s číselnými znaky

Zahrňte ověření rozpoznaných číselných řetězců, abyste potvrdili přesnost a odstranili zobrazení falešné hodnoty uživateli.

Ovladač dokumentové kamery je nejlepším společníkem pro rozpoznávání textu, protože kvalita obrazu hraje významnou roli při rozpoznávání textu.

Pro zvýšení výkonu zvažte nastavení minimální výšky textu.

S Vision máte vše, co potřebujete pro rozpoznávání textu. Vzhledem k tomu, že se Vision snadno používá a jeho implementace trvá krátkou dobu, je jeho použití téměř ekvivalentní hraní s Legem. Zkuste aplikaci otestovat na různých objektech, písmech, osvětlení a velikostech. Zapůsobit na sebe můžete také kombinací Vision s Core ML.


Leave a Comment

Jak změnit tapetu zprávy na iPhonu

Jak změnit tapetu zprávy na iPhonu

Aplikace iMessage na iPhonu nabízí možnost změnit pozadí zprávy pomocí obrázku na pozadí poskytnutého aplikací nebo použít fotografii odeslanou v konverzaci jako pozadí zprávy na iPhonu.

Jak vložit emoji do fotografií na iPhone velmi jednoduše

Jak vložit emoji do fotografií na iPhone velmi jednoduše

Abychom mohli vkládat emoji do fotografií na iPhonu, budeme potřebovat pár malých triků, podle níže uvedeného návodu.

Která bezplatná VPN je nejlepší pro iPhone a iPad?

Která bezplatná VPN je nejlepší pro iPhone a iPad?

VPN mají řadu výhod, jako je ochrana vaší online identity a umožnění přístupu k obsahu v jiných zemích. Můžete dokonce zaznamenat vyšší rychlost připojení.

Smažte těchto 10 předinstalovaných aplikací ihned po zakoupení iPhonu!

Smažte těchto 10 předinstalovaných aplikací ihned po zakoupení iPhonu!

iPhone je dodáván s desítkami předinstalovaných aplikací, které vám pomohou začít, ale ne všechny se vyplatí ponechat. Jistě, některé jsou opravdu užitečné a nepostradatelné, ale jiné jen tak sedí bez většího přínosu.

5 tipů pro zobrazení historie počítače na iPhonu

5 tipů pro zobrazení historie počítače na iPhonu

Ačkoli na iPhonu není možnost zobrazit historii počítače, uživatelé mohou použít několik způsobů, jak si historii počítače na iPhonu prohlédnout.

Jak zapnout oznámení o čištění fotoaparátu iPhonu

Jak zapnout oznámení o čištění fotoaparátu iPhonu

V systému iOS 26 má Apple novou užitečnou funkci, která upozorní uživatele, že je třeba vyčistit objektiv fotoaparátu iPhonu, pokud je znečištěný.

Jak najít zmeškané hovory z neznámých čísel na iPhone

Jak najít zmeškané hovory z neznámých čísel na iPhone

Po aktualizaci iPhonu na iOS 26 se zmeškané hovory z neznámých čísel nezobrazují v sekci Hovory ani Nedávné v aplikaci Telefon.

Jak snadno a rychle zapnout NFC na iPhone

Jak snadno a rychle zapnout NFC na iPhone

Near Field Communication je bezdrátová technologie, která umožňuje zařízením vyměňovat si data, když jsou v těsné blízkosti od sebe, obvykle do několika centimetrů.

Mẹo mở ảnh mới nhất trên iPhone cực nhanh

Mẹo mở ảnh mới nhất trên iPhone cực nhanh

Việc nhấn và giữ ứng dụng biểu tượng trên iPhone sẽ cung cấp cho bạn nhiều tùy chọn hơn. Dưới đây là thủ thuật mở ảnh mới nhất trên iPhone.

6 aplikací pro iPhone, díky kterým jsou widgety skutečně užitečné

6 aplikací pro iPhone, díky kterým jsou widgety skutečně užitečné

Widgety mají iPhone učinit užitečnějším, ale většina z nich nenaplňuje svůj potenciál. Ale pár aplikací konečně dokáže widgety udělat užitečnějšími.