Kako ustvariti API REST za globoko učenje z Word2Vec in Flask

Tradicionalne pristope k razvoju je težko vzdrževati pri uporabi kompleksnih modelov strojnega učenja v proizvodnji. Razvoj na prenosnem računalniku ali lokalnem stroju je lahko počasen pri usposabljanju modela strojnega učenja za inženirje globokega učenja. Posledično običajno uporabljamo stroje v oblaku z zmogljivejšo strojno opremo za usposabljanje in izvajanje naših modelov strojnega učenja. To je dobra praksa, saj abstrahiramo kompleksno računanje in namesto tega po potrebi izdelamo zahteve AJAX. V tej vadnici bomo omogočili vnaprej usposobljeni model globokega učenja z imenom Word2Vec na voljo drugim storitvam z izgradnjo REST API-ja od začetka.

Predpogoji

  • Primerek strežnika Ubuntu 16.04 z vsaj 4 GB RAM-a. Za namene testiranja in razvoja lahko izberete primerek s 4 GB RAM-a
  • Razumevanje uporabe operacijskega sistema Linux za ustvarjanje/krmarjenje/urejanje map in datotek
  • sudouporabnik

Kaj so vdelave besed?

Vdelave besed so nedavni razvoj v obdelavi naravnega jezika in globokem učenju, ki je zaradi hitrega napredka revolucioniral obe področji. Vdelave besed so v bistvu vektorji, od katerih vsak ustreza eni sami besedi, tako da vektorji pomenijo besede. To je mogoče dokazati z nekaterimi pojavi, kot je vektor za king - queen = boy - girl. Besedni vektorji se uporabljajo za gradnjo vsega, od motorjev za priporočila do klepetalnic, ki dejansko razumejo angleški jezik.

Vdelave besed niso naključne; nastanejo z usposabljanjem nevronske mreže. Nedavna zmogljiva implementacija vdelave besed prihaja od Googla z imenom Word2Vec, ki je usposobljen s predvidevanjem besed, ki se pojavljajo poleg drugih besed v jeziku. Na primer, za besedo "cat"bo nevronska mreža napovedala besede "kitten"in "feline". Ta intuicija besed, ki se pojavljajo ena blizu druge, nam omogoča, da jih postavimo v vektorski prostor.

Vendar pa v praksi običajno uporabljamo predhodno usposobljene modele drugih velikih korporacij, kot je Google, da hitro izdelamo prototip in poenostavimo postopke uvajanja. V tej vadnici bomo prenesli in uporabili Googlove predhodno usposobljene vdelave besed za Word2Vec. To lahko storimo tako, da zaženemo naslednji ukaz v našem delovnem imeniku.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Namestitev paketov Flask in Magnitude

Model za vdelavo besed, ki smo ga prenesli, je v .magnitudeobliki. Ta oblika nam omogoča učinkovito poizvedovanje po modelu z uporabo SQL in je zato optimalna oblika vdelave za produkcijske strežnike. Ker moramo biti sposobni prebrati .magnitudeformat, bomo namestili pymagnitudepaket. Namestili bomo tudi, flaskda bomo kasneje služili napovedi globokega učenja, ki jih je izdelal model.

pip3 install pymagnitude flask

Dodali ga bomo tudi našemu sledilniku odvisnosti z naslednjim ukazom. To ustvari datoteko z imenom requirements.txtin shrani naše knjižnice Python, tako da jih lahko pozneje znova namestimo.

pip3 freeze > requirements.txt

Poizvedovanje po modelu Word2Vec

Za začetek bomo ustvarili datoteko za upravljanje odpiranja in poizvedovanja po vdelanih besedah.

touch model.py

Nato bomo dodali naslednje vrstice model.pyza uvoz Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

S pymagnitudepaketom in modelom globokega učenja se lahko poigramo z uporabo querymetode in zagotovimo argument za besedo.

cat_vector = vectors.query('cat')
print(cat_vector)

Za jedro našega API-ja bomo definirali funkcijo, ki bo vrnila razliko v pomenu med dvema besedama. To je osnova za večino rešitev globokega učenja za stvari, kot so motorji priporočil (tj. prikazovanje vsebine s podobnimi besedami).

S to funkcijo se lahko igramo z uporabo funkcij similarityin most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Kalkulator podobnosti izvajamo na naslednji način. To metodo bo v naslednjem razdelku poklical API Flask. Upoštevajte, da ta funkcija vrne realno vrednost med 0 in 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Ustvarjanje REST API-ja

Naš strežnik bomo ustvarili v datoteki service.pyz naslednjo vsebino. Uvažamo flaskin requestupravljamo z zmogljivostmi naših strežnikov ter uvozimo similaritymotor iz modula, ki smo ga napisali prej.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Naš strežnik je precej gole kosti, vendar ga je mogoče enostavno razširiti z ustvarjanjem več poti z uporabo @app.routedekoratorja.

Izvajanje klicev API

Naš strežnik Flask lahko zaženemo tako, da zaženemo naslednje ukaze za aktiviranje našega virtualnega okolja, namestitev naših paketov in zagon povezane datoteke Python.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Naš strežnik bo na voljo na localhost:8000. Lahko poizvedemo našo bazo podatkov localhost:8000/similarity?word1=cat&word2=dogin si ogledamo odgovor bodisi v našem brskalniku bodisi prek drugega odjemalca AJAX.


Namestite Plesk na CentOS 7

Namestite Plesk na CentOS 7

Uporaba drugega sistema? Plesk je lastniška nadzorna plošča spletnega gostitelja, ki uporabnikom omogoča upravljanje svojih osebnih in/ali strank spletnih mest, baz podatkov

Namestite Lets Encrypt SSL v aplikacijo WordPress z enim klikom

Namestite Lets Encrypt SSL v aplikacijo WordPress z enim klikom

Uvod Lets Encrypt je storitev overitelja potrdil, ki ponuja brezplačna potrdila TLS/SSL. Certbot poenostavlja postopek namestitve,

Ustvarjanje bloga Jekyll v Ubuntu 16.04

Ustvarjanje bloga Jekyll v Ubuntu 16.04

Uporaba drugega sistema? Jekyll je odlična alternativa WordPressu za bloganje ali deljenje vsebine. Ne zahteva nobenih baz podatkov in je zelo enostaven i

Kako nastaviti nenadzorovane nadgradnje na Debian 9 (raztegni)

Kako nastaviti nenadzorovane nadgradnje na Debian 9 (raztegni)

Uporaba drugega sistema? Če kupite strežnik Debian, morate vedno imeti najnovejše varnostne popravke in posodobitve, ne glede na to, ali spite ali ne

Kako namestiti in konfigurirati PHP 7.0 ali PHP 7.1 na Ubuntu 16.04

Kako namestiti in konfigurirati PHP 7.0 ali PHP 7.1 na Ubuntu 16.04

PHP in sorodni paketi so najpogosteje uporabljene komponente pri uvajanju spletnega strežnika. V tem članku se bomo naučili, kako nastaviti PHP 7.0 ali PHP 7.1 o

Kako namestiti Squid Proxy na CentOS

Kako namestiti Squid Proxy na CentOS

Squid je priljubljen brezplačen program za Linux, ki vam omogoča ustvarjanje spletnega proxyja za posredovanje. V tem priročniku boste videli, kako namestiti Squid na CentOS, da vas obrne

Kako namestiti Lighttpd (LLMP Stack) na CentOS 6

Kako namestiti Lighttpd (LLMP Stack) na CentOS 6

Uvod Lighttpd je razdelek Apache, katerega namen je biti veliko manj intenziven vir. Je lahek, od tod tudi njegovo ime, in je precej preprost za uporabo. Namestite

Tri brezplačne nadzorne plošče strežnika (hitra namestitev)

Tri brezplačne nadzorne plošče strežnika (hitra namestitev)

1. Virtualmin/Webmin Virtualmin je zmogljiva in prilagodljiva nadzorna plošča za spletno gostovanje za sisteme Linux in UNIX, ki temelji na dobro znani odprtokodni spletni bazi

Nastavitev aplikacije Yii na Ubuntu 14.04

Nastavitev aplikacije Yii na Ubuntu 14.04

Yii je okvir PHP, ki vam omogoča hitrejši in preprostejši razvoj aplikacij. Namestitev Yii na Ubuntu je enostavna, saj se boste naučili natančno

Uporaba zaslona v Ubuntu 14.04

Uporaba zaslona v Ubuntu 14.04

Screen je aplikacija, ki omogoča večkratno uporabo terminalskih sej v enem oknu. To vam omogoča simulacijo več terminalskih oken, kjer je ma

Nastavite svoj DNS strežnik na Debian/Ubuntu

Nastavite svoj DNS strežnik na Debian/Ubuntu

Ta vadnica pojasnjuje, kako nastaviti strežnik DNS z uporabo Bind9 v Debianu ali Ubuntuju. V celotnem članku ustrezno nadomestite your-domain-name.com. Ob th

Uporaba Logrotate za upravljanje dnevniških datotek

Uporaba Logrotate za upravljanje dnevniških datotek

Uvod Logrotate je pripomoček za Linux, ki poenostavlja upravljanje dnevniških datotek. Običajno se izvaja enkrat na dan prek opravila cron in upravlja bazo dnevnikov

Konfiguriranje statičnega omrežja in IPv6 na CentOS 7

Konfiguriranje statičnega omrežja in IPv6 na CentOS 7

VULTR je pred kratkim naredil spremembe na svoji strani in zdaj bi moralo vse delovati v redu iz škatle z omogočenim NetworkManagerjem. Če želite onemogočiti

Spreminjanje Icinga2 za uporabo modela Master/Client na CentOS 6 ali CentOS 7

Spreminjanje Icinga2 za uporabo modela Master/Client na CentOS 6 ali CentOS 7

Icinga2 je zmogljiv sistem za spremljanje in če se uporablja v modelu glavni-odjemalec, lahko nadomesti potrebo po nadzornih pregledih, ki temeljijo na NRPE. Glavni naročnik

Nastavite Red5 Media Server na Ubuntu 16.04

Nastavite Red5 Media Server na Ubuntu 16.04

Uporaba drugega sistema? Red5 je odprtokodni medijski strežnik, implementiran v Javi, ki vam omogoča zagon večuporabniških aplikacij Flash, kot je prenos v živo

Prevedite in namestite Nginx z modulom PageSpeed ​​na Debian 8

Prevedite in namestite Nginx z modulom PageSpeed ​​na Debian 8

V tem članku bomo videli, kako prevesti in namestiti Nginx mainline iz uradnih virov Nginxa z modulom PageSpeed, ki vam omogoča

Kako namestiti Apache Cassandra 3.11.x na Ubuntu 16.04 LTS

Kako namestiti Apache Cassandra 3.11.x na Ubuntu 16.04 LTS

Uporaba drugega sistema? Apache Cassandra je brezplačen in odprtokodni sistem za upravljanje baz podatkov NoSQL, ki je zasnovan tako, da zagotavlja razširljivost, visoko

Kako namestiti Apache Cassandra 3.11.x na CentOS 7

Kako namestiti Apache Cassandra 3.11.x na CentOS 7

Uporaba drugega sistema? Apache Cassandra je brezplačen in odprtokodni sistem za upravljanje baz podatkov NoSQL, ki je zasnovan tako, da zagotavlja razširljivost, visoko

Kako namestiti Vanilla Forum na Ubuntu 16.04

Kako namestiti Vanilla Forum na Ubuntu 16.04

Uporaba drugega sistema? Vanilla forum je odprtokodna forumska aplikacija, napisana v PHP. Je popolnoma prilagodljiv, enostaven za uporabo in podpira zunanjost

Kako namestiti Kanboard na Ubuntu 18.04 LTS

Kako namestiti Kanboard na Ubuntu 18.04 LTS

Uporaba drugega sistema? Uvod Kanboard je brezplačen in odprtokodni program za vodenje projektov, ki je zasnovan za olajšanje in vizualizacijo

Vzpon strojev: aplikacije AI v resničnem svetu

Vzpon strojev: aplikacije AI v resničnem svetu

Umetna inteligenca ni v prihodnosti, tukaj je prav v sedanjosti. V tem blogu preberite, kako so aplikacije umetne inteligence vplivale na različne sektorje.

DDOS napadi: kratek pregled

DDOS napadi: kratek pregled

Ste tudi vi žrtev DDOS napadov in ste zmedeni glede načinov preprečevanja? Preberite ta članek, če želite rešiti svoja vprašanja.

Ste se kdaj vprašali, kako hekerji zaslužijo denar?

Ste se kdaj vprašali, kako hekerji zaslužijo denar?

Morda ste že slišali, da hekerji zaslužijo veliko denarja, a ste se kdaj vprašali, kako zaslužijo takšen denar? razpravljajmo.

Revolucionarni Googlovi izumi, ki vam bodo olajšali življenje.

Revolucionarni Googlovi izumi, ki vam bodo olajšali življenje.

Ali želite videti revolucionarne izume Googla in kako so ti izumi danes spremenili življenje vsakega človeka? Nato preberite v blogu in si oglejte Googlove izume.

Friday Essential: Kaj se je zgodilo z avtomobili, ki jih poganja umetna inteligenca?

Friday Essential: Kaj se je zgodilo z avtomobili, ki jih poganja umetna inteligenca?

Koncept samovozečih avtomobilov, ki zapeljejo na ceste s pomočjo umetne inteligence, so sanje, ki jih imamo že nekaj časa. A kljub številnim obljubam jih ni nikjer. Preberite ta blog, če želite izvedeti več…

Tehnološka singularnost: oddaljena prihodnost človeške civilizacije?

Tehnološka singularnost: oddaljena prihodnost človeške civilizacije?

Ker se znanost hitro razvija in prevzame veliko naših prizadevanj, se povečuje tudi tveganje, da se podvržemo nerazložljivi singularnosti. Preberite, kaj bi za nas lahko pomenila singularnost.

Razvoj shranjevanja podatkov – Infografika

Razvoj shranjevanja podatkov – Infografika

Metode shranjevanja podatkov so se lahko razvijale od rojstva podatkov. Ta blog pokriva razvoj shranjevanja podatkov na podlagi infografike.

Funkcionalnosti slojev referenčne arhitekture velikih podatkov

Funkcionalnosti slojev referenčne arhitekture velikih podatkov

Preberite blog, če želite na najpreprostejši način spoznati različne plasti v arhitekturi velikih podatkov in njihove funkcionalnosti.

6 neverjetnih prednosti pametnih naprav za dom v našem življenju

6 neverjetnih prednosti pametnih naprav za dom v našem življenju

V tem digitalno vodenem svetu so pametne naprave za dom postale ključni del življenja. Tukaj je nekaj neverjetnih prednosti pametnih naprav za dom o tem, kako naredijo naše življenje vredno življenja in poenostavijo.

Posodobitev dodatka macOS Catalina 10.15.4 povzroča več težav kot jih rešuje

Posodobitev dodatka macOS Catalina 10.15.4 povzroča več težav kot jih rešuje

Pred kratkim je Apple izdal macOS Catalina 10.15.4 dopolnilno posodobitev za odpravo težav, vendar se zdi, da posodobitev povzroča več težav, ki vodijo do opečenja računalnikov Mac. Preberite ta članek, če želite izvedeti več