Kako stvoriti REST API za duboko učenje s Word2Vec i Flaskom

Tradicionalne pristupe razvoju teško je održati kada se u proizvodnji koriste složeni modeli strojnog učenja. Razvoj na prijenosnom računalu ili lokalnom stroju može biti spor za obuku modela strojnog učenja za inženjere dubokog učenja. Kao rezultat toga, obično koristimo strojeve u oblaku sa snažnijim hardverom za obuku i pokretanje naših modela strojnog učenja. Ovo je dobra praksa jer apstrahiramo složeno računanje i umjesto toga postavljamo AJAX zahtjeve prema potrebi. U ovom vodiču učinit ćemo unaprijed obučeni model dubokog učenja nazvan Word2Vec dostupnim drugim uslugama izgradnjom REST API-ja od temelja.

Preduvjeti

  • Instanca poslužitelja Ubuntu 16.04 s najmanje 4 GB RAM-a. Za potrebe testiranja i razvoja možete odabrati instancu s 4 GB RAM-a
  • Razumijevanje kako koristiti operativni sustav Linux za stvaranje/navigaciju/uređivanje mapa i datoteka
  • sudokorisnika

Što su Word Embeddings?

Ugrađivanje riječi nedavni je razvoj u obradi prirodnog jezika i dubokom učenju koji je revolucionirao oba polja zbog brzog napretka. Ugrađivanje riječi su u biti vektori od kojih svaki odgovara jednoj riječi tako da vektori znače riječi. To se može pokazati određenim pojavama kao što je vektor za king - queen = boy - girl. Vektori riječi koriste se za izgradnju svega, od mehanizama za preporuke do chat-bota koji zapravo razumiju engleski jezik.

Ugrađivanje riječi nije slučajno; generiraju se treniranjem neuronske mreže. Nedavna snažna implementacija ugrađivanja riječi dolazi od Googlea pod nazivom Word2Vec koji se trenira predviđanjem riječi koje se pojavljuju pored drugih riječi u jeziku. Na primjer, za riječ "cat", neuronska mreža će predvidjeti riječi "kitten"i "feline". Ova intuicija riječi koje se pojavljuju jedna blizu druge omogućuje nam da ih smjestimo u vektorski prostor.

Međutim, u praksi smo skloni koristiti unaprijed obučene modele drugih velikih korporacija kao što je Google kako bismo brzo izradili prototip i pojednostavili procese implementacije. U ovom vodiču ćemo preuzeti i koristiti Googleov Word2Vec unaprijed obučeni ugradnji riječi. To možemo učiniti pokretanjem sljedeće naredbe u našem radnom direktoriju.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Instaliranje paketa Flask i Magnitude

Model za ugradnju riječi koji smo preuzeli je u .magnitudeformatu. Ovaj nam format omogućuje učinkovito ispitivanje modela pomoću SQL-a i stoga je optimalan format za ugradnju za proizvodne poslužitelje. Budući da moramo moći čitati .magnitudeformat, instalirat ćemo pymagnitudepaket. Također ćemo instalirati flaskkako bismo kasnije poslužili predviđanjima dubokog učenja koje je napravio model.

pip3 install pymagnitude flask

Također ćemo ga dodati u naš alat za praćenje ovisnosti sa sljedećom naredbom. Time se stvara datoteka s imenom requirements.txti sprema naše Python biblioteke kako bismo ih kasnije mogli ponovno instalirati.

pip3 freeze > requirements.txt

Postavljanje upita prema modelu Word2Vec

Za početak ćemo izraditi datoteku za rukovanje otvaranjem i upitom za ugrađivanje riječi.

touch model.py

Zatim ćemo dodati sljedeće retke model.pyza uvoz Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Možemo se poigrati s pymagnitudepaketom i modelom dubokog učenja korištenjem querymetode, dajući argument za riječ.

cat_vector = vectors.query('cat')
print(cat_vector)

Za jezgru našeg API-ja definirat ćemo funkciju koja vraća razliku u značenju između dvije riječi. Ovo je okosnica za većinu rješenja za duboko učenje za stvari kao što su mehanizam za preporuke (tj. prikazivanje sadržaja sa sličnim riječima).

Možemo se poigrati s ovom funkcijom pomoću mogućnosti similarityi most_similar funkcije.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Kalkulator sličnosti implementiramo na sljedeći način. Ovu metodu će pozvati Flask API u sljedećem odjeljku. Imajte na umu da ova funkcija vraća stvarnu vrijednost između 0 i 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Izrada REST API-ja

Napravit ćemo naš poslužitelj u datoteci pod nazivom service.pysa sljedećim sadržajem. Uvozimo flaski requestupravljamo našim mogućnostima poslužitelja i uvozimo similaritymotor iz modula koji smo ranije napisali.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Naš poslužitelj je prilično neobičan, ali se lako može proširiti stvaranjem više ruta pomoću @app.routedekoratora.

Upućivanje API poziva

Možemo pokrenuti naš Flask poslužitelj pokretanjem sljedećih naredbi za aktivaciju našeg virtualnog okruženja, instaliranje naših paketa i pokretanje pridružene Python datoteke.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Naš poslužitelj će biti dostupan na adresi localhost:8000. Možemo postaviti upit u našu bazu podataka localhost:8000/similarity?word1=cat&word2=dogi vidjeti odgovor bilo u našem pregledniku ili putem drugog AJAX klijenta.


Instalirajte Plesk na CentOS 7

Instalirajte Plesk na CentOS 7

Korištenje drugog sustava? Plesk je vlasnička upravljačka ploča web hosta koja omogućuje korisnicima da administriraju svoje osobne i/ili klijentske web stranice, baze podataka

Postavite Cacti na Debian Jessie

Postavite Cacti na Debian Jessie

Uvod Cacti je alat otvorenog koda za praćenje i crtanje koji se u potpunosti temelji na RRD podacima. Putem Cactusa možete pratiti gotovo sve vrste uređaja

Instalirajte Lets Encrypt SSL na WordPress aplikaciju jednim klikom

Instalirajte Lets Encrypt SSL na WordPress aplikaciju jednim klikom

Uvod Lets Encrypt je usluga za izdavanje certifikata koja nudi besplatne TLS/SSL certifikate. Certbot pojednostavljuje proces instalacije,

Kako postaviti Tekkit Classic Server na Ubuntu 16.10

Kako postaviti Tekkit Classic Server na Ubuntu 16.10

Korištenje drugog sustava? Što je Tekkit Classic? Tekkit Classic je modpack za igru ​​koju svi znaju i vole; Minecraft. Sadrži neke od ver

Postavite iRedMail na Debian Wheezy

Postavite iRedMail na Debian Wheezy

Korištenje drugog sustava? Ovaj vodič će vam pokazati kako instalirati grupni softver iRedMail na novu instalaciju Debian Wheezyja. Trebali biste koristiti servis

Izrada Jekyll bloga na Ubuntu 16.04

Izrada Jekyll bloga na Ubuntu 16.04

Korištenje drugog sustava? Jekyll je izvrsna alternativa WordPressu za bloganje ili dijeljenje sadržaja. Ne zahtijeva nikakve baze podataka i vrlo je jednostavan i

Kako postaviti nenadzirane nadogradnje na Debianu 9 (protežu)

Kako postaviti nenadzirane nadogradnje na Debianu 9 (protežu)

Korištenje drugog sustava? Ako kupite Debian poslužitelj, uvijek biste trebali imati najnovije sigurnosne zakrpe i ažuriranja, bez obzira spavate li ili ne

Kako instalirati i konfigurirati PHP 7.0 ili PHP 7.1 na Ubuntu 16.04

Kako instalirati i konfigurirati PHP 7.0 ili PHP 7.1 na Ubuntu 16.04

PHP i povezani paketi najčešće su korištene komponente prilikom postavljanja web poslužitelja. U ovom članku ćemo naučiti kako postaviti PHP 7.0 ili PHP 7.1 o

Kako instalirati Squid proxy na CentOS

Kako instalirati Squid proxy na CentOS

Squid je popularan besplatni program za Linux koji vam omogućuje stvaranje web proxyja za prosljeđivanje. U ovom vodiču vidjet ćete kako instalirati Squid na CentOS da vas preokrene

Kako instalirati Lighttpd (LLMP Stack) na CentOS 6

Kako instalirati Lighttpd (LLMP Stack) na CentOS 6

Uvod Lighttpd je fork Apachea koji ima za cilj da bude puno manje intenzivan prema resursima. Lagan je, otuda mu i naziv, i prilično je jednostavan za korištenje. Instaliraj

Korištenje zaslona na Ubuntu 14.04

Korištenje zaslona na Ubuntu 14.04

Screen je aplikacija koja omogućuje višestruko korištenje terminalskih sesija unutar jednog prozora. To vam omogućuje da simulirate više prozora terminala gdje je ma

Postavite svoj vlastiti DNS poslužitelj na Debian/Ubuntu

Postavite svoj vlastiti DNS poslužitelj na Debian/Ubuntu

Ovaj vodič objašnjava kako postaviti DNS poslužitelj pomoću Bind9 na Debianu ili Ubuntu. U cijelom članku u skladu s tim zamijenite your-domain-name.com. Na th

Konfiguriranje statičkog umrežavanja i IPv6 na CentOS 7

Konfiguriranje statičkog umrežavanja i IPv6 na CentOS 7

VULTR je nedavno napravio promjene na svojoj strani i sada bi sve trebalo raditi dobro iz kutije s omogućenim NetworkManagerom. Želite li onemogućiti

Promjena Icinga2 za korištenje modela Master/Client na CentOS 6 ili CentOS 7

Promjena Icinga2 za korištenje modela Master/Client na CentOS 6 ili CentOS 7

Icinga2 je moćan sustav nadzora, a kada se koristi u modelu master-client, može zamijeniti potrebu za provjerama praćenja na temelju NRPE. Glavni klijent

Postavite Red5 Media Server na Ubuntu 16.04

Postavite Red5 Media Server na Ubuntu 16.04

Korištenje drugog sustava? Red5 je medijski poslužitelj otvorenog koda implementiran u Javi koji vam omogućuje pokretanje Flash višekorisničkih aplikacija kao što je live streamin

Prevedite i instalirajte Nginx s modulom PageSpeed ​​na Debian 8

Prevedite i instalirajte Nginx s modulom PageSpeed ​​na Debian 8

U ovom članku ćemo vidjeti kako sastaviti i instalirati Nginx mainline iz službenih izvora Nginxa s modulom PageSpeed, koji vam omogućuje da

Kako instalirati Vanilla Forum na Ubuntu 16.04

Kako instalirati Vanilla Forum na Ubuntu 16.04

Korištenje drugog sustava? Vanilla forum je aplikacija otvorenog koda napisana u PHP-u. Potpuno je prilagodljiv, jednostavan za korištenje i podržava eksterne

Kako instalirati Kanboard na Ubuntu 18.04 LTS

Kako instalirati Kanboard na Ubuntu 18.04 LTS

Korištenje drugog sustava? Uvod Kanboard je besplatni softver za upravljanje projektima otvorenog koda koji je dizajniran za olakšavanje i vizualizaciju

Kako instalirati Kanboard na Debian 9

Kako instalirati Kanboard na Debian 9

Korištenje drugog sustava? Uvod Kanboard je besplatni softver za upravljanje projektima otvorenog koda koji je dizajniran za olakšavanje i vizualizaciju

Kako instalirati Giteu na Debian 9

Kako instalirati Giteu na Debian 9

Korištenje drugog sustava? Gitea je alternativni sustav za kontrolu verzija otvorenog koda s vlastitim hostom koji pokreće Git. Gitea je napisana na Golangu i jest

Uspon strojeva: primjene AI u stvarnom svijetu

Uspon strojeva: primjene AI u stvarnom svijetu

Umjetna inteligencija nije u budućnosti, ovdje je upravo u sadašnjosti. U ovom blogu Pročitajte kako su aplikacije umjetne inteligencije utjecale na različite sektore.

DDOS napadi: kratak pregled

DDOS napadi: kratak pregled

Jeste li i vi žrtva DDOS napada i zbunjeni ste metodama prevencije? Pročitajte ovaj članak kako biste riješili svoje upite.

Jeste li se ikada zapitali kako hakeri zarađuju novac?

Jeste li se ikada zapitali kako hakeri zarađuju novac?

Možda ste čuli da hakeri zarađuju mnogo novca, ali jeste li se ikada zapitali kako zarađuju toliki novac? raspravimo.

Revolucionarni Googleovi izumi koji će vam olakšati život.

Revolucionarni Googleovi izumi koji će vam olakšati život.

Želite li vidjeti revolucionarne izume Googlea i kako su ti izumi promijenili život svakog čovjeka danas? Zatim čitajte na blogu kako biste vidjeli Googleove izume.

Friday Essential: Što se dogodilo s automobilima s umjetnom inteligencijom?

Friday Essential: Što se dogodilo s automobilima s umjetnom inteligencijom?

Koncept samovozećih automobila koji će krenuti na ceste uz pomoć umjetne inteligencije san je koji već neko vrijeme imamo. No, unatoč nekoliko obećanja, nigdje ih nema. Pročitajte ovaj blog kako biste saznali više…

Tehnološka singularnost: daleka budućnost ljudske civilizacije?

Tehnološka singularnost: daleka budućnost ljudske civilizacije?

Kako se znanost razvija velikom brzinom, preuzimajući mnoge naše napore, raste i rizik da se podvrgnemo neobjašnjivoj Singularnosti. Pročitajte što bi za nas mogla značiti singularnost.

Evolucija pohrane podataka – Infografika

Evolucija pohrane podataka – Infografika

Metode pohrane podataka su se razvijale možda od rođenja podataka. Ovaj blog pokriva evoluciju pohrane podataka na temelju infografike.

Funkcionalnosti slojeva referentne arhitekture velikih podataka

Funkcionalnosti slojeva referentne arhitekture velikih podataka

Pročitajte blog kako biste na najjednostavniji način upoznali različite slojeve u arhitekturi velikih podataka i njihove funkcionalnosti.

6 nevjerojatnih prednosti posjedovanja pametnih kućnih uređaja u našim životima

6 nevjerojatnih prednosti posjedovanja pametnih kućnih uređaja u našim životima

U ovom digitalnom svijetu, pametni kućni uređaji postali su ključni dio života. Evo nekoliko nevjerojatnih prednosti pametnih kućnih uređaja o tome kako naš život čine vrijednim življenja i jednostavnijim.

Ažuriranje dodataka macOS Catalina 10.15.4 uzrokuje više problema nego što ih rješava

Ažuriranje dodataka macOS Catalina 10.15.4 uzrokuje više problema nego što ih rješava

Nedavno je Apple izdao macOS Catalina 10.15.4 dodatak ažuriranju kako bi riješio probleme, ali čini se da ažuriranje uzrokuje više problema koji dovode do zalijevanja mac strojeva. Pročitajte ovaj članak da biste saznali više