Si të krijoni një API REST të mësimit të thellë me Word2Vec dhe Flask

Qasjet tradicionale të zhvillimit janë të vështira për t'u ruajtur kur përdoren modele komplekse të mësimit të makinerive në prodhim. Zhvillimi në një laptop ose makineri lokale mund të jetë i ngadalshëm për të trajnuar modelin e mësimit të makinës për inxhinierët e të mësuarit të thellë. Si rezultat, ne zakonisht përdorim makina cloud me pajisje më të fuqishme për të trajnuar dhe drejtuar modelet tona të mësimit të makinerive. Kjo është praktikë e mirë pasi ne abstraktojmë llogaritjet komplekse dhe në vend të kësaj bëjmë kërkesa AJAX sipas nevojës. Në këtë tutorial, ne do të vëmë në dispozicion të shërbimeve të tjera një model të para-trajnuar të mësimit të thellë të quajtur Word2Vec duke ndërtuar një API REST nga themeli.

Parakushtet

  • Një shembull i serverit Ubuntu 16.04 me të paktën 4 GB RAM. Për qëllime testimi dhe zhvillimi, mund të zgjidhni një shembull me 4 GB RAM
  • Kuptimi se si të përdoret sistemi operativ Linux për të krijuar/naviguar/redaktuar dosje dhe skedarë
  • Një sudopërdorues

Çfarë janë futjet e fjalëve?

Përfshirja e fjalëve është një zhvillim i fundit në përpunimin e gjuhës natyrore dhe mësimin e thellë që ka revolucionarizuar të dyja fushat për shkak të përparimit të shpejtë. Përfshirjet e fjalëve janë në thelb vektorë që secili korrespondon me një fjalë të vetme në mënyrë që vektorët të nënkuptojnë fjalët. Kjo mund të demonstrohet nga disa dukuri të tilla si vektori për king - queen = boy - girl. Vektorët e fjalëve përdoren për të ndërtuar gjithçka, nga motorët e rekomandimeve te robotët e bisedës që në fakt kuptojnë gjuhën angleze.

Përfshirjet e fjalëve nuk janë të rastësishme; ato krijohen duke trajnuar një rrjet nervor. Një zbatim i fuqishëm i fundit i futjes së fjalëve vjen nga Google me emrin Word2Vec i cili është trajnuar duke parashikuar fjalët që shfaqen pranë fjalëve të tjera në një gjuhë. Për shembull, për fjalën "cat", rrjeti nervor do të parashikojë fjalët "kitten"dhe "feline". Kjo intuitë e fjalëve që shfaqen pranë njëra-tjetrës na lejon t'i vendosim ato në hapësirën vektoriale.

Megjithatë, në praktikë, ne priremi të përdorim modelet e para-trajnuara të korporatave të tjera të mëdha si Google, në mënyrë që të prototipojmë shpejt dhe të thjeshtojmë proceset e vendosjes. Në këtë tutorial ne do të shkarkojmë dhe përdorim futjet e fjalëve të para-trajnuara të Google Word2Vec. Ne mund ta bëjmë këtë duke ekzekutuar komandën e mëposhtme në drejtorinë tonë të punës.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Instalimi i paketave Flask dhe Magnitude

Modeli i ngulitjes së fjalëve që kemi shkarkuar është në një .magnitudeformat. Ky format na lejon të kërkojmë modelin në mënyrë efikase duke përdorur SQL, dhe për këtë arsye është formati optimal i ngulitjes për serverët e prodhimit. Meqenëse duhet të jemi në gjendje të lexojmë .magnitudeformatin, do ta instalojmë pymagnitudepaketën. Ne gjithashtu do të instalojmë flaskpër të shërbyer më vonë parashikimet e mësimit të thellë të bëra nga modeli.

pip3 install pymagnitude flask

Ne gjithashtu do ta shtojmë atë në gjurmuesin tonë të varësisë me komandën e mëposhtme. Kjo krijon një skedar të quajtur requirements.txtdhe ruan bibliotekat tona Python në mënyrë që ne t'i riinstalojmë ato në një kohë të mëvonshme.

pip3 freeze > requirements.txt

Kërkimi i modelit Word2Vec

Për të filluar, ne do të krijojmë një skedar për të trajtuar hapjen dhe kërkimin e futjeve të fjalëve.

touch model.py

Më pas, ne do të shtojmë rreshtat e mëposhtëm për model.pytë importuar Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Ne mund të luajmë me pymagnitudepaketën dhe modelin e të mësuarit të thellë duke përdorur querymetodën, duke ofruar një argument për një fjalë.

cat_vector = vectors.query('cat')
print(cat_vector)

Për thelbin e API-së tonë, ne do të përcaktojmë një funksion për të kthyer ndryshimin në kuptim midis dy fjalëve. Kjo është shtylla kurrizore për shumicën e zgjidhjeve të të mësuarit të thellë për gjëra të tilla si motorët e rekomandimeve (dmth. shfaqja e përmbajtjes me fjalë të ngjashme).

Ne mund të luajmë me këtë funksion duke përdorur funksionet similaritydhe most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Ne zbatojmë kalkulatorin e ngjashmërisë si më poshtë. Kjo metodë do të thirret nga API Flask në seksionin tjetër. Vini re se ky funksion kthen një vlerë reale midis 0 dhe 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Krijimi i një API REST

Ne do të krijojmë serverin tonë në një skedar të quajtur service.pyme përmbajtjen e mëposhtme. Ne importojmë flaskdhe requestpër të trajtuar aftësitë e serverit tonë dhe importojmë similaritymotorin nga moduli që kemi shkruar më parë.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Serveri ynë është mjaft i zhveshur, por mund të zgjerohet lehtësisht duke krijuar më shumë rrugë duke përdorur @app.routedekoruesin.

Kryerja e thirrjeve API

Ne mund të ekzekutojmë serverin tonë Flask duke ekzekutuar komandat e mëposhtme për të aktivizuar mjedisin tonë virtual, për të instaluar paketat tona dhe për të ekzekutuar skedarin e lidhur Python.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Serveri ynë do të jetë i disponueshëm në localhost:8000. Ne mund të kërkojmë në bazën tonë të të dhënave localhost:8000/similarity?word1=cat&word2=dogdhe ta shohim përgjigjen ose në shfletuesin tonë ose përmes një klienti tjetër AJAX.


Instaloni Plesk në CentOS 7

Instaloni Plesk në CentOS 7

Përdorimi i një sistemi të ndryshëm? Plesk është një panel kontrolli i pronarit të hostit në internet që lejon përdoruesit të administrojnë faqet e tyre të internetit personale dhe/ose të klientëve, bazat e të dhënave

Instaloni Lets Encrypt SSL në aplikacionin WordPress me një klik

Instaloni Lets Encrypt SSL në aplikacionin WordPress me një klik

Hyrje Lets Encrypt është një shërbim i autoritetit certifikues që ofron certifikata falas TLS/SSL. Procesi i instalimit është thjeshtuar nga Certbot,

Si të instaloni dhe konfiguroni PHP 7.0 ose PHP 7.1 në Ubuntu 16.04

Si të instaloni dhe konfiguroni PHP 7.0 ose PHP 7.1 në Ubuntu 16.04

PHP dhe paketat e lidhura me to janë komponentët më të përdorur gjatë vendosjes së një serveri në internet. Në këtë artikull, ne do të mësojmë se si të konfigurojmë PHP 7.0 ose PHP 7.1 o

Si të instaloni Lighttpd (LLMP Stack) në CentOS 6

Si të instaloni Lighttpd (LLMP Stack) në CentOS 6

Hyrje Lighttpd është një fork i Apache që synon të jetë shumë më pak intensiv me burime. Është i lehtë, prandaj emri i tij, dhe është mjaft i thjeshtë për t'u përdorur. Instaloni

Tre panele kontrolli të serverit falas (Instalim i shpejtë)

Tre panele kontrolli të serverit falas (Instalim i shpejtë)

1. Virtualmin/Webmin Virtualmin është një panel kontrolli i fuqishëm dhe fleksibël i hostimit në internet për sistemet Linux dhe UNIX i bazuar në bazën e mirënjohur të internetit me burim të hapur.

Vendosja e një aplikacioni Yii në Ubuntu 14.04

Vendosja e një aplikacioni Yii në Ubuntu 14.04

Yii është një kornizë PHP që ju lejon të zhvilloni aplikacione më shpejt dhe më lehtë. Instalimi i Yii në Ubuntu është i thjeshtë, siç do të mësoni saktësisht

Përdorimi i ekranit në Ubuntu 14.04

Përdorimi i ekranit në Ubuntu 14.04

Screen është një aplikacion që lejon përdorimin e shumëfishtë të sesioneve të terminalit brenda një dritareje. Kjo ju lejon të simuloni dritare të shumta terminale ku është ma

Konfiguro serverin tuaj DNS në Debian/Ubuntu

Konfiguro serverin tuaj DNS në Debian/Ubuntu

Ky tutorial shpjegon se si të konfiguroni një server DNS duke përdorur Bind9 në Debian ose Ubuntu. Gjatë gjithë artikullit, zëvendësoni emrin e domain-it tuaj në përputhje me rrethanat. Në

Përdorimi i Logrotate për të menaxhuar skedarët e regjistrave

Përdorimi i Logrotate për të menaxhuar skedarët e regjistrave

Hyrje Logrotate është një mjet Linux që thjeshton administrimin e skedarëve të regjistrit. Zakonisht funksionon një herë në ditë përmes një pune cron dhe menaxhon bazën e regjistrave

Konfigurimi i rrjeteve statike dhe IPv6 në CentOS 7

Konfigurimi i rrjeteve statike dhe IPv6 në CentOS 7

VULTR kohët e fundit ka bërë ndryshime në fund të tyre dhe gjithçka duhet të funksionojë mirë tani me NetworkManager të aktivizuar. Nëse dëshironi të çaktivizoni

Modifikimi i Icinga2 për të përdorur Modelin Master/Klient në CentOS 6 ose CentOS 7

Modifikimi i Icinga2 për të përdorur Modelin Master/Klient në CentOS 6 ose CentOS 7

Icinga2 është një sistem i fuqishëm monitorimi dhe kur përdoret në një model master-klient, ai mund të zëvendësojë nevojën për kontrolle monitorimi të bazuara në NRPE. Master-klien

Përpiloni dhe instaloni Nginx me Modulin e PageSpeed ​​në Debian 8

Përpiloni dhe instaloni Nginx me Modulin e PageSpeed ​​në Debian 8

Në këtë artikull, ne do të shohim se si të përpiloni dhe instaloni Nginx mainline nga burimet zyrtare të Nginx me modulin PageSpeed, i cili ju lejon t

Si të instaloni Gitea në Debian 9

Si të instaloni Gitea në Debian 9

Përdorimi i një sistemi të ndryshëm? Gitea është një sistem alternativ i kontrollit të versionit me burim të hapur, i vetë-pritur, i mundësuar nga Git. Gitea është shkruar në Golang dhe është

Si të instaloni Gitea në Ubuntu 18.04

Si të instaloni Gitea në Ubuntu 18.04

Përdorimi i një sistemi të ndryshëm? Gitea është një sistem alternativ i kontrollit të versionit me burim të hapur, i vetë-pritur, i mundësuar nga git. Gitea është shkruar në Golang dhe është

Si të instaloni MODX Revolution në një FreeBSD 11 FAMP VPS

Si të instaloni MODX Revolution në një FreeBSD 11 FAMP VPS

Përdorimi i një sistemi të ndryshëm? MODX Revolution është një Sistem i Menaxhimit të Përmbajtjes (CMS) i shpejtë, fleksibël, i shkallëzuar, me burim të hapur, i shkallës së ndërmarrjes, i shkruar në PHP. Ajo i

Instalimi i Docker CE në Ubuntu 16.04

Instalimi i Docker CE në Ubuntu 16.04

Përdorimi i një sistemi të ndryshëm? Docker është një aplikacion që lejon vendosjen e programeve që ekzekutohen si kontejnerë. Ishte shkruar në programin popullor Go

Si të instaloni Golang 1.8.3 në CentOS 7, Ubuntu 16.04 dhe Debian 9

Si të instaloni Golang 1.8.3 në CentOS 7, Ubuntu 16.04 dhe Debian 9

Golang është një gjuhë programimi e zhvilluar nga Google. Falë shkathtësisë, thjeshtësisë dhe besueshmërisë së tij, Golang është bërë një nga më të populluarit

Përmirësimi i shfrytëzimit të lopës së pistë në CentOS

Përmirësimi i shfrytëzimit të lopës së pistë në CentOS

Çfarë është Lopa e Pistë (CVE-2016-5195)? Dobësia e Dirty Cow shfrytëzohet përmes mënyrës se si Linux përpunon kodin. Ai lejon që një përdorues i paprivilegjuar të gai

Konfiguro një përdorues jo-rrënjë me Sudo Access në Ubuntu

Konfiguro një përdorues jo-rrënjë me Sudo Access në Ubuntu

Të kesh vetëm një përdorues, i cili është root, mund të jetë i rrezikshëm. Pra, le ta rregullojmë atë. Vultr na ofron lirinë për të bërë si të duam me përdoruesit dhe serverët tanë

Rivendosni fjalëkalimin rrënjësor MySQL në Debian/Ubuntu

Rivendosni fjalëkalimin rrënjësor MySQL në Debian/Ubuntu

Nëse e keni harruar fjalëkalimin tuaj rrënjësor MySQL, mund ta rivendosni atë duke ndjekur hapat në këtë artikull. Procesi është mjaft i thjeshtë dhe funksionon në to

Ngritja e makinave: Aplikimet në botën reale të AI

Ngritja e makinave: Aplikimet në botën reale të AI

Inteligjenca Artificiale nuk është në të ardhmen, është këtu në të tashmen Në këtë blog Lexoni se si aplikacionet e inteligjencës artificiale kanë ndikuar në sektorë të ndryshëm.

Sulmet DDOS: Një përmbledhje e shkurtër

Sulmet DDOS: Një përmbledhje e shkurtër

A jeni edhe ju viktimë e Sulmeve DDOS dhe jeni konfuz në lidhje me metodat e parandalimit? Lexoni këtë artikull për të zgjidhur pyetjet tuaja.

A e keni pyetur ndonjëherë veten se si fitojnë para hakerët?

A e keni pyetur ndonjëherë veten se si fitojnë para hakerët?

Ju mund të keni dëgjuar se hakerët fitojnë shumë para, por a keni menduar ndonjëherë se si i fitojnë ato para? Le te diskutojme.

Shpikjet revolucionare nga Google që do tju bëjnë të lehtë jetën tuaj.

Shpikjet revolucionare nga Google që do tju bëjnë të lehtë jetën tuaj.

Dëshironi të shihni shpikjet revolucionare nga Google dhe se si këto shpikje ndryshuan jetën e çdo njeriu sot? Më pas lexoni në blog për të parë shpikjet nga Google.

E Premte Thelbësore: Çfarë ndodhi me Makinat e drejtuara nga AI?

E Premte Thelbësore: Çfarë ndodhi me Makinat e drejtuara nga AI?

Koncepti i makinave vetë-drejtuese për të dalë në rrugë me ndihmën e inteligjencës artificiale është një ëndërr që e kemi prej kohësh. Por, pavarësisht nga disa premtime, ato nuk shihen askund. Lexoni këtë blog për të mësuar më shumë…

Singulariteti teknologjik: Një e ardhme e largët e qytetërimit njerëzor?

Singulariteti teknologjik: Një e ardhme e largët e qytetërimit njerëzor?

Ndërsa Shkenca evoluon me një ritëm të shpejtë, duke marrë përsipër shumë nga përpjekjet tona, rriten edhe rreziqet për t'iu nënshtruar një Singulariteti të pashpjegueshëm. Lexoni, çfarë mund të thotë singulariteti për ne.

Evolucioni i ruajtjes së të dhënave - Infografik

Evolucioni i ruajtjes së të dhënave - Infografik

Metodat e ruajtjes së të dhënave kanë evoluar mund të jenë që nga lindja e të dhënave. Ky blog mbulon evolucionin e ruajtjes së të dhënave në bazë të një infografike.

Funksionalitetet e shtresave të arkitekturës së referencës së të dhënave të mëdha

Funksionalitetet e shtresave të arkitekturës së referencës së të dhënave të mëdha

Lexoni blogun për të njohur shtresat e ndryshme në arkitekturën e të dhënave të mëdha dhe funksionalitetet e tyre në mënyrën më të thjeshtë.

6 Përfitimet e mahnitshme të të pasurit pajisje shtëpiake inteligjente në jetën tonë

6 Përfitimet e mahnitshme të të pasurit pajisje shtëpiake inteligjente në jetën tonë

Në këtë botë të drejtuar nga dixhitali, pajisjet inteligjente të shtëpisë janë bërë një pjesë thelbësore e jetës. Këtu janë disa përfitime të mahnitshme të pajisjeve shtëpiake inteligjente se si ato e bëjnë jetën tonë të vlefshme dhe më të thjeshtë.

Përditësimi shtesë i macOS Catalina 10.15.4 po shkakton më shumë probleme sesa zgjidhja

Përditësimi shtesë i macOS Catalina 10.15.4 po shkakton më shumë probleme sesa zgjidhja

Së fundmi Apple lëshoi ​​macOS Catalina 10.15.4 një përditësim shtesë për të rregulluar problemet, por duket se përditësimi po shkakton më shumë probleme që çojnë në bricking të makinerive mac. Lexoni këtë artikull për të mësuar më shumë