Hvernig á að búa til Deep Learning REST API með Word2Vec og Flask

Erfitt er að viðhalda hefðbundnum aðferðum við þróun þegar flókin vélanámslíkön eru notuð í framleiðslu. Þróun á fartölvu eða staðbundinni vél getur verið hæg til að þjálfa vélanámslíkanið fyrir djúpnámsverkfræðinga. Fyrir vikið notum við venjulega skýjavélar með öflugri vélbúnaði til að bæði þjálfa og keyra vélanámslíkön okkar. Þetta er góð venja þar sem við tökum saman flókna útreikninga og gerum í staðinn AJAX beiðnir eftir þörfum. Í þessari kennslu munum við gera fyrirfram þjálfað djúpnámslíkan sem heitir Word2Vec aðgengilegt fyrir aðra þjónustu með því að byggja upp REST API frá grunni.

Forkröfur

  • Ubuntu 16.04 netþjónstilvik með að minnsta kosti 4GB vinnsluminni. Í prófunar- og þróunarskyni geturðu valið tilvik með 4GB vinnsluminni
  • Skilningur á því hvernig á að nota Linux stýrikerfið til að búa til/flotta/breyta möppum og skrám
  • A sudonotandi

Hvað eru orð innfellingar?

Orðainnfelling er nýleg þróun í náttúrulegri málvinnslu og djúpnámi sem hefur gjörbylt báðum sviðum vegna örra framfara. Orðainnfellingar eru í meginatriðum vektorar sem hver um sig samsvarar einu orði þannig að vigrarnir þýða orðin. Þetta er hægt að sýna fram á með ákveðnum fyrirbærum eins og vektornum fyrir king - queen = boy - girl. Orðvigrar eru notaðir til að byggja allt frá meðmælavélum til spjallbotna sem skilja í raun ensku.

Innfelling orða er ekki tilviljunarkennd; þau verða til með því að þjálfa taugakerfi. Nýleg öflug innfelld orðaútfærsla kemur frá Google sem heitir Word2Vec sem er þjálfuð með því að spá fyrir um orð sem birtast við hlið annarra orða á tungumáli. Til dæmis, fyrir orðið "cat", mun tauganetið spá fyrir um orðin "kitten"og "feline". Þetta innsæi orða sem birtast nálægt hvert öðru gerir okkur kleift að setja þau í vektorrými.

Hins vegar, í reynd, höfum við tilhneigingu til að nota fyrirfram þjálfuð líkön annarra stórfyrirtækja eins og Google til að gera fljótt frumgerð og einfalda dreifingarferli. Í þessari kennslu munum við hlaða niður og nota Word2Vec fyrirfram þjálfað orð innfellingar frá Google. Við getum gert þetta með því að keyra eftirfarandi skipun í vinnuskránni okkar.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Uppsetning á flöskunni og stærðarpakkanum

Orðainnfellingarlíkanið sem við haluðum niður er á .magnitudesniði. Þetta snið gerir okkur kleift að spyrjast fyrir um líkanið á skilvirkan hátt með því að nota SQL og er því ákjósanlegasta innfellingarsniðið fyrir framleiðsluþjóna. Þar sem við þurfum að geta lesið .magnitudesniðið munum við setja upp pymagnitudepakkann. Við munum einnig setja upp flasktil að þjóna síðar spár um djúpnám sem líkanið gerir.

pip3 install pymagnitude flask

Við munum einnig bæta því við rekja spor einhvers með eftirfarandi skipun. Þetta býr til skrá sem heitir requirements.txtog vistar Python bókasöfnin okkar svo við getum sett þau upp aftur síðar.

pip3 freeze > requirements.txt

Spurning um Word2Vec líkanið

Til að byrja, munum við búa til skrá til að sjá um opnun og fyrirspurn um orðinnfellingar.

touch model.py

Næst munum við bæta eftirfarandi línum við model.pytil að flytja inn Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Við getum leikið okkur með pymagnitudepakkann og djúpnámslíkanið með því að nota queryaðferðina og koma með rök fyrir orði.

cat_vector = vectors.query('cat')
print(cat_vector)

Fyrir kjarna API okkar munum við skilgreina aðgerð til að skila merkingarmuninum á milli tveggja orða. Þetta er burðarás fyrir flestar djúpnámslausnir fyrir hluti eins og meðmælavélar (þ.e. sýna efni með svipuðum orðum).

Við getum leikið okkur með þessa aðgerð með því að nota similarityog most_similar aðgerðirnar.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Við útfærum líkindareiknivélina sem hér segir. Þessi aðferð verður kölluð af Flask API í næsta kafla. Athugaðu að þessi aðgerð skilar raungildi á milli 0 og 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Að búa til REST API

Við munum búa til netþjóninn okkar í skrá sem heitir service.pymeð eftirfarandi innihaldi. Við flytjum inn flaskog requesttil að sjá um getu miðlara okkar og við flytjum inn similarityvélina úr einingunni sem við skrifuðum áðan.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Miðlarinn okkar er frekar beinn, en auðvelt er að stækka hann með því að búa til fleiri leiðir með @app.routeskreytingunni.

Að hringja í API

Við getum keyrt Flask netþjóninn okkar með því að keyra eftirfarandi skipanir til að virkja sýndarumhverfið okkar, setja upp pakkana okkar og keyra tengda Python skrána.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Miðlarinn okkar verður aðgengilegur kl localhost:8000. Við getum spurt gagnagrunninn okkar á localhost:8000/similarity?word1=cat&word2=dogog skoðað svarið annað hvort í vafranum okkar eða í gegnum annan AJAX viðskiptavin.

Skildu eftir athugasemd

The Rise of Machines: Real World Applications of AI

The Rise of Machines: Real World Applications of AI

Gervigreind er ekki í framtíðinni, hún er hér í nútímanum Í þessu bloggi Lestu hvernig gervigreindarforrit hafa haft áhrif á ýmsa geira.

DDOS árásir: Stutt yfirlit

DDOS árásir: Stutt yfirlit

Ertu líka fórnarlamb DDOS árása og ruglaður með forvarnaraðferðirnar? Lestu þessa grein til að leysa spurningar þínar.

Hefur þú einhvern tíma velt því fyrir þér hvernig tölvuþrjótar græða peninga?

Hefur þú einhvern tíma velt því fyrir þér hvernig tölvuþrjótar græða peninga?

Þú gætir hafa heyrt að tölvuþrjótar græða mikið af peningum, en hefur þú einhvern tíma velt því fyrir þér hvernig þeir vinna sér inn svona peninga? við skulum ræða.

Byltingarkenndar uppfinningar frá Google sem munu auðvelda lífi þínu.

Byltingarkenndar uppfinningar frá Google sem munu auðvelda lífi þínu.

Viltu sjá byltingarkenndar uppfinningar frá Google og hvernig þessar uppfinningar breyttu lífi hvers manns í dag? Lestu síðan til að blogga til að sjá uppfinningar frá Google.

Föstudagur Nauðsynlegur: Hvað varð um gervigreindardrifna bíla?

Föstudagur Nauðsynlegur: Hvað varð um gervigreindardrifna bíla?

Hugmyndin um að sjálfkeyrandi bílar fari á göturnar með hjálp gervigreindar er draumur sem við höfum átt um tíma núna. En þrátt fyrir nokkur loforð eru þau hvergi sjáanleg. Lestu þetta blogg til að læra meira…

Tæknileg sérkenni: Fjarlæg framtíð mannlegrar siðmenningar?

Tæknileg sérkenni: Fjarlæg framtíð mannlegrar siðmenningar?

Þar sem vísindin þróast hratt og taka yfir mikið af viðleitni okkar, eykst hættan á því að verða fyrir óútskýranlegri einstæðu. Lestu, hvað sérkenni gæti þýtt fyrir okkur.

Virkni Big Data Reference Architecture Layers

Virkni Big Data Reference Architecture Layers

Lestu bloggið til að þekkja mismunandi lög í Big Data Architecture og virkni þeirra á einfaldasta hátt.

Þróun gagnageymslu – Infographic

Þróun gagnageymslu – Infographic

Geymsluaðferðir gagna hafa verið að þróast gæti verið frá fæðingu gagna. Þetta blogg fjallar um þróun gagnageymslu á grundvelli upplýsingamynda.

6 ótrúlegir kostir þess að hafa snjall heimilistæki í lífi okkar

6 ótrúlegir kostir þess að hafa snjall heimilistæki í lífi okkar

Í þessum stafræna heimi hafa snjallheimilistæki orðið afgerandi hluti af lífi. Hér eru nokkrir ótrúlegir kostir snjallheimatækja um hvernig þau gera líf okkar þess virði að lifa því og einfaldara.

macOS Catalina 10.15.4 viðbót uppfærsla veldur fleiri vandamálum en að leysa

macOS Catalina 10.15.4 viðbót uppfærsla veldur fleiri vandamálum en að leysa

Nýlega gaf Apple út macOS Catalina 10.15.4 viðbótaruppfærslu til að laga vandamál en svo virðist sem uppfærslan sé að valda fleiri vandamálum sem leiða til múrsteins á Mac vélum. Lestu þessa grein til að læra meira