Kako ustvariti API REST za globoko učenje z Word2Vec in Flask

Predpogoji

Kaj so vdelave besed?

Namestitev paketov Flask in Magnitude

Poizvedovanje po modelu Word2Vec

Ustvarjanje REST API-ja

Izvajanje klicev API

Tradicionalne pristope k razvoju je težko vzdrževati pri uporabi kompleksnih modelov strojnega učenja v proizvodnji. Razvoj na prenosnem računalniku ali lokalnem stroju je lahko počasen pri usposabljanju modela strojnega učenja za inženirje globokega učenja. Posledično običajno uporabljamo stroje v oblaku z zmogljivejšo strojno opremo za usposabljanje in izvajanje naših modelov strojnega učenja. To je dobra praksa, saj abstrahiramo kompleksno računanje in namesto tega po potrebi izdelamo zahteve AJAX. V tej vadnici bomo omogočili vnaprej usposobljeni model globokega učenja z imenom Word2Vec na voljo drugim storitvam z izgradnjo REST API-ja od začetka.

Predpogoji

Primerek strežnika Ubuntu 16.04 z vsaj 4 GB RAM-a. Za namene testiranja in razvoja lahko izberete primerek s 4 GB RAM-a
Razumevanje uporabe operacijskega sistema Linux za ustvarjanje/krmarjenje/urejanje map in datotek
sudouporabnik

Kaj so vdelave besed?

Vdelave besed so nedavni razvoj v obdelavi naravnega jezika in globokem učenju, ki je zaradi hitrega napredka revolucioniral obe področji. Vdelave besed so v bistvu vektorji, od katerih vsak ustreza eni sami besedi, tako da vektorji pomenijo besede. To je mogoče dokazati z nekaterimi pojavi, kot je vektor za king - queen = boy - girl. Besedni vektorji se uporabljajo za gradnjo vsega, od motorjev za priporočila do klepetalnic, ki dejansko razumejo angleški jezik.

Vdelave besed niso naključne; nastanejo z usposabljanjem nevronske mreže. Nedavna zmogljiva implementacija vdelave besed prihaja od Googla z imenom Word2Vec, ki je usposobljen s predvidevanjem besed, ki se pojavljajo poleg drugih besed v jeziku. Na primer, za besedo "cat"bo nevronska mreža napovedala besede "kitten"in "feline". Ta intuicija besed, ki se pojavljajo ena blizu druge, nam omogoča, da jih postavimo v vektorski prostor.

Vendar pa v praksi običajno uporabljamo predhodno usposobljene modele drugih velikih korporacij, kot je Google, da hitro izdelamo prototip in poenostavimo postopke uvajanja. V tej vadnici bomo prenesli in uporabili Googlove predhodno usposobljene vdelave besed za Word2Vec. To lahko storimo tako, da zaženemo naslednji ukaz v našem delovnem imeniku.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Namestitev paketov Flask in Magnitude

Model za vdelavo besed, ki smo ga prenesli, je v .magnitudeobliki. Ta oblika nam omogoča učinkovito poizvedovanje po modelu z uporabo SQL in je zato optimalna oblika vdelave za produkcijske strežnike. Ker moramo biti sposobni prebrati .magnitudeformat, bomo namestili pymagnitudepaket. Namestili bomo tudi, flaskda bomo kasneje služili napovedi globokega učenja, ki jih je izdelal model.

pip3 install pymagnitude flask

Dodali ga bomo tudi našemu sledilniku odvisnosti z naslednjim ukazom. To ustvari datoteko z imenom requirements.txtin shrani naše knjižnice Python, tako da jih lahko pozneje znova namestimo.

pip3 freeze > requirements.txt

Poizvedovanje po modelu Word2Vec

Za začetek bomo ustvarili datoteko za upravljanje odpiranja in poizvedovanja po vdelanih besedah.

touch model.py

Nato bomo dodali naslednje vrstice model.pyza uvoz Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

S pymagnitudepaketom in modelom globokega učenja se lahko poigramo z uporabo querymetode in zagotovimo argument za besedo.

cat_vector = vectors.query('cat')
print(cat_vector)

Za jedro našega API-ja bomo definirali funkcijo, ki bo vrnila razliko v pomenu med dvema besedama. To je osnova za večino rešitev globokega učenja za stvari, kot so motorji priporočil (tj. prikazovanje vsebine s podobnimi besedami).

S to funkcijo se lahko igramo z uporabo funkcij similarityin most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Kalkulator podobnosti izvajamo na naslednji način. To metodo bo v naslednjem razdelku poklical API Flask. Upoštevajte, da ta funkcija vrne realno vrednost med 0 in 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Ustvarjanje REST API-ja

Naš strežnik bomo ustvarili v datoteki service.pyz naslednjo vsebino. Uvažamo flaskin requestupravljamo z zmogljivostmi naših strežnikov ter uvozimo similaritymotor iz modula, ki smo ga napisali prej.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Naš strežnik je precej gole kosti, vendar ga je mogoče enostavno razširiti z ustvarjanjem več poti z uporabo @app.routedekoratorja.

Izvajanje klicev API

Naš strežnik Flask lahko zaženemo tako, da zaženemo naslednje ukaze za aktiviranje našega virtualnega okolja, namestitev naših paketov in zagon povezane datoteke Python.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Naš strežnik bo na voljo na localhost:8000. Lahko poizvedemo našo bazo podatkov localhost:8000/similarity?word1=cat&word2=dogin si ogledamo odgovor bodisi v našem brskalniku bodisi prek drugega odjemalca AJAX.

Pusti komentar

Komentar *

Ime *

Spletna stran

Vzpon strojev: aplikacije AI v resničnem svetu

Umetna inteligenca ni v prihodnosti, tukaj je prav v sedanjosti. V tem blogu preberite, kako so aplikacije umetne inteligence vplivale na različne sektorje.

DDOS napadi: kratek pregled

Ste tudi vi žrtev DDOS napadov in ste zmedeni glede načinov preprečevanja? Preberite ta članek, če želite rešiti svoja vprašanja.

Ste se kdaj vprašali, kako hekerji zaslužijo denar?

Morda ste že slišali, da hekerji zaslužijo veliko denarja, a ste se kdaj vprašali, kako zaslužijo takšen denar? razpravljajmo.

Revolucionarni Googlovi izumi, ki vam bodo olajšali življenje.

Ali želite videti revolucionarne izume Googla in kako so ti izumi danes spremenili življenje vsakega človeka? Nato preberite v blogu in si oglejte Googlove izume.

Friday Essential: Kaj se je zgodilo z avtomobili, ki jih poganja umetna inteligenca?

Koncept samovozečih avtomobilov, ki zapeljejo na ceste s pomočjo umetne inteligence, so sanje, ki jih imamo že nekaj časa. A kljub številnim obljubam jih ni nikjer. Preberite ta blog, če želite izvedeti več…

Tehnološka singularnost: oddaljena prihodnost človeške civilizacije?

Ker se znanost hitro razvija in prevzame veliko naših prizadevanj, se povečuje tudi tveganje, da se podvržemo nerazložljivi singularnosti. Preberite, kaj bi za nas lahko pomenila singularnost.

Funkcionalnosti slojev referenčne arhitekture velikih podatkov

Preberite blog, če želite na najpreprostejši način spoznati različne plasti v arhitekturi velikih podatkov in njihove funkcionalnosti.

Razvoj shranjevanja podatkov – Infografika

Metode shranjevanja podatkov so se lahko razvijale od rojstva podatkov. Ta blog pokriva razvoj shranjevanja podatkov na podlagi infografike.

6 neverjetnih prednosti pametnih naprav za dom v našem življenju

V tem digitalno vodenem svetu so pametne naprave za dom postale ključni del življenja. Tukaj je nekaj neverjetnih prednosti pametnih naprav za dom o tem, kako naredijo naše življenje vredno življenja in poenostavijo.

Posodobitev dodatka macOS Catalina 10.15.4 povzroča več težav kot jih rešuje

Pred kratkim je Apple izdal macOS Catalina 10.15.4 dopolnilno posodobitev za odpravo težav, vendar se zdi, da posodobitev povzroča več težav, ki vodijo do opečenja računalnikov Mac. Preberite ta članek, če želite izvedeti več