iPhone: Как да използвате функциите за откриване на текст на iOS

Vision в iOS 11 има всичко необходимо, за да създадете приложение, което може да разпознава текстови знаци, като имплементацията се извършва едновременно. Не се нуждаете от технически познания за кодиране – навигацията в функцията е доста проста. Нещо повече, изпълнението е безпроблемно.

Vision Framework

Визията ви позволява лесно да изпълнявате всяка задача, която включва компютърни детайли. Структурата извършва разпознаване на лице и ориентир, разпознаване на баркод, регистрация на изображения, проследяване на общи характеристики и откриване на текст. Vision също така ви позволява да използвате персонализирани модели на Core ML за задачи като класификация или откриване на обекти.

VN DetectTextRectanglesRequest

В  VN DetectTextRectanglesRequest  е заявка за анализ на изображения, която намира региони видим текст в изображение; функцията връща текстови знаци като правоъгълна ограничаваща кутия с произход и размер.

Ако сте свикнали да използвате swift и сте програмирали от известно време, тогава вероятно се чудите каква е ползата от Vision, когато има други функции като изображение и AVFoundation. Е, Vision е по-точен и по-прост. Функцията е достъпна и на различни платформи. Въпреки това, използването на Vision може да изисква повече процесорна мощност и време за обработка.

За да използвате Vision за откриване на текст, ще ви е необходим Xcode 9 и устройство, което работи с iOS 11.

Създаване на камера с Avcapture

Първо, трябва да създадете камера с  AVCapture ; това е чрез инициализиране на един обект AVcapturesession за извършване на заснемане в реално време или офлайн. След това направете сесията към връзката на устройството.

За да ви спести време от изграждането на потребителски интерфейс на вашето приложение, помислете за стартов проект, като за начало това ще ви даде време да се съсредоточите върху изучаването на рамката Vision.

Отворете своя стартов проект. Изгледите в сценария трябва да са готови и настроени за вас.

В  ViewController.swift  потърсете кодовата секция с функции и изходи.

Под outlet- ImageView декларирайте сесия за  AVcapturesession  – това се използва винаги, когато искате да се извършват действия въз основа на поток на живо.

Задайте  AVcapturesession  и  AVmediatype  на видео, тъй като ще извършите заснемането с камера, за да го активирате да работи непрекъснато

Определете изходното и входното устройство

Входът е това, което камерата ще види, а изходът е видеото в зададен тип формат KCVPixelFormatType_32GRA.

Накрая добавете  подслой,  който съдържа видеоклипове към  imageView  и започнете сесията. Функцията е известна като  inViewdidload.  Също така трябва да зададете рамката на слоя.

Извикайте функцията в метода  viewWillAppear  .

Тъй като границите все още не са финализирани,  заменете метода viewDidLayoutSubviews ( )  , за да актуализирате обвързаните слоеве.

След пускането на iOS 10 е необходим допълнителен запис в Info.plist, това дава причина за използване на камерата. Трябва също да зададете описание на използването на камерата за поверителност.

Разпознаване на текст; Как работи Vision Framework

Има три стъпки за внедряване на Vision в приложението.

Манипулатори –  това е, когато искате рамката да направи нещо, след като заявката бъде извикана.

Наблюдения –  това е, което искате да направите с предоставените от вас данни, започвайки с една заявка

Заявки –  това е, когато поискате фреймворк Detect

В идеалния случай създавате една текстова заявка като  VNdetecttextrectanglesrequest . Това е вид  VNrequest,  който граничи около текста. След като рамката завърши приложението, продължавате да извиквате функцията  Dettexthandler  . Вие също ще искате да знаете точния кадър, който е бил разпознат, задайте го на  Reportcharacterboxes =True.

След това дефинирайте наблюденията, които съдържат всички резултати от  VNdetecttextrectanglesrequest , не забравяйте да добавите Vision към изходната камера. Тъй като Vision разкрива API на високо ниво, работата с него е сигурна.

Функцията проверява дали  Cmsamplebuffer  съществува и PutOut  Avcaptureoutput . След това трябва да продължите да създавате една променлива  Requeststoptions  като 1 речник тип  VNimageoption . Опцията  VNmage  е тип структура, която съдържа свойства и данни от камерата. След това трябва да създадете  VNimagerequesthandler  и да изпълните текстовата заявка.

Начертаване на граници около открития текст

Можете да започнете, като имате рамката, за да нарисувате две кутии, една за всяка буква, която открива, а другата за всяка дума. Таблиците са комбинацията от всички полета за знаци, които вашата заявка ще намери.

  • Определете точките във вашия изглед, за да ви помогне да позиционирате кутиите.
  • След това създайте  CALaye r; използвайте  VNrectangleobservation, за  да дефинирате вашите ограничения, което улеснява процеса на очертаване на полето.

Вече разполагате с всичките си функции.

За да свържете точките си, започнете с асинхронно изпълнение на кода. След това трябва да проверите дали съществува регион във вашите резултати от вашия  VNTextObservation .

Вече можете да извикате вашата функция, която ще начертае кутия в областта. Проверете дали има полета за знаци в региона, след което се обадете на услугата, която въвежда поле около всяка буква.

След това създайте променлива  RequestOptions. Вече можете да създадете  обект VNImageRequestHandler  и да изпълните текстовата заявка, която сте създали.

И накрая, последната стъпка е да стартирате кода на вашата визия с потока на живо. Ще трябва да вземете видео изхода и да го конвертирате в  Cmsamplebuffer.

Допълнителни съвети

Винаги се опитвайте да изрежете изображението и да обработвате само секцията, от която се нуждаете. Това ще намали времето за обработка и отпечатъка на паметта

Включете корекцията на езика, когато работите с нецифрови знаци, след това я изключете, когато работите с цифров знак

Включете валидиране за разпознати числови низове, за да потвърдите точността и да премахнете показването на фалшива стойност на потребителя.

Контролерът на документ камерата е най-добрият спътник за разпознаване на текст, тъй като качеството на изображението играе важна роля при разпознаването на текст.

Помислете за задаване на минимална височина на текста, за да увеличите производителността.

С Vision имате всичко необходимо за разпознаване на текст. Тъй като Vision е лесен за използване и отнема кратко време за изпълнение, използването му е почти еквивалентно на игра с Legos. Опитайте да тествате приложението си върху различни обекти, шрифтове, осветление и размери. Можете също да се впечатлите, като комбинирате Vision с Core ML.


Leave a Comment

9 настройки за поверителност на iPhone, които трябва да включите веднага

9 настройки за поверителност на iPhone, които трябва да включите веднага

Apple се справя по-добре от повечето компании, когато става въпрос за поверителност. Но не всички настройки по подразбиране на iPhone са в най-добрия интерес на потребителя.

Как да отворите ChatGPT с бутон за действие на iPhone

Как да отворите ChatGPT с бутон за действие на iPhone

Чрез този бутон за действие можете да извикате ChatGPT, когато пожелаете, на телефона си. Ето ръководство за отваряне на ChatGPT с помощта на бутона за действие на iPhone.

Как да правите дълги екранни снимки на iPhone, правете скрийншотове с превъртане на iPhone

Как да правите дълги екранни снимки на iPhone, правете скрийншотове с превъртане на iPhone

Как да направите дълга екранна снимка на iPhone ви помага лесно да заснемете цялата уеб страница. Функцията за превъртане на екрана на iPhone е достъпна на iOS 13, iOS 14 и ето подробно ръководство за това как да направите дълга екранна снимка на iPhone.

Инструкциите за промяна на парола за iCloud са много прости

Инструкциите за промяна на парола за iCloud са много прости

За да промените паролата си за iCloud, можете да го направите по много различни начини. Можете да промените паролата си за iCloud на компютъра си или на телефона си чрез приложение за поддръжка.

Инструкции за присъединяване към споделени албуми на iPhone

Инструкции за присъединяване към споделени албуми на iPhone

Когато изпращате съвместен албум на iPhone на някой друг, той ще трябва да се съгласи да се присъедини към него. Има няколко начина да приемете покани за споделяне на албум на iPhone, както е показано по-долу.

Как да намерите изгубени AirPods

Как да намерите изгубени AirPods

Тъй като AirPods са малки и леки, понякога е лесно да се загубят. Добрата новина е, че преди да започнете да разкъсвате къщата си в търсене на изгубените си слушалки, можете да ги проследите с помощта на вашия iPhone.

4 функции на iPhone, които не работят в някои страни

4 функции на iPhone, които не работят в някои страни

Знаете ли, че в зависимост от региона, където е произведен вашият iPhone, той може да има разлики в сравнение с iPhone-ите, продавани в други страни?

Как да търсите изображения с Google Images на телефона си

Как да търсите изображения с Google Images на телефона си

Обратното търсене на изображения на iPhone е много лесно, когато можете да използвате браузъра на устройството или да използвате някои приложения на трети страни за повече опции за търсене.

Инструкциите за осъществяване на бързи повиквания на iPhone са много прости

Инструкциите за осъществяване на бързи повиквания на iPhone са много прости

Ако често се налага да се свързвате с някого, можете да настроите бързи повиквания на вашия iPhone с няколко прости стъпки.

Инструкции за завъртане на екрана на iPhone на всички модели

Инструкции за завъртане на екрана на iPhone на всички модели

Хоризонталното завъртане на екрана на iPhone ви помага да гледате филми или Netflix, да преглеждате PDF файлове, да играете игри... по-удобно и да имате по-добро изживяване.