Kuinka luoda Deep Learning REST API Word2Vecillä ja Flaskilla

Perinteisiä kehitystapoja on vaikea ylläpitää, kun tuotannossa käytetään monimutkaisia ​​koneoppimismalleja. Kehittäminen kannettavalla tietokoneella tai paikallisella koneella voi olla hidasta koneoppimismallin kouluttamisessa syväoppimisen insinööreille. Tämän seurauksena käytämme yleensä tehokkaammilla laitteistoilla varustettuja pilvikoneita koneoppimismalliemme kouluttamiseen ja suorittamiseen. Tämä on hyvä käytäntö, koska abstraktimme monimutkaisen laskennan ja teemme sen sijaan AJAX-pyyntöjä tarpeen mukaan. Tässä opetusohjelmassa tuomme valmiiksi koulutetun Word2Vec-nimisen syväoppimismallin muiden palvelujen saataville rakentamalla REST API:n alusta alkaen.

Edellytykset

  • Ubuntu 16.04 -palvelinesiintymä, jossa on vähintään 4 Gt RAM-muistia. Testaus- ja kehitystarkoituksiin voit valita esiintymän, jossa on 4 Gt RAM-muistia
  • Ymmärtää kuinka käyttää Linux-käyttöjärjestelmää kansioiden ja tiedostojen luomiseen/navigointiin/muokkaukseen
  • sudokäyttäjä

Mitä ovat Wordin upotukset?

Sanojen upotukset ovat viimeaikainen kehitys luonnollisen kielen käsittelyssä ja syväoppimisessa, joka on mullistanut molemmat alat nopean edistymisen ansiosta. Sanojen upotukset ovat pohjimmiltaan vektoreita, joista jokainen vastaa yhtä sanaa siten, että vektorit tarkoittavat sanoja. Tämä voidaan osoittaa tietyillä ilmiöillä, kuten vektorilla king - queen = boy - girl. Sanavektoreita käytetään rakentamaan kaikkea suositusmoottoreista chat-botteihin, jotka todella ymmärtävät englannin kieltä.

Sanojen upotukset eivät ole satunnaisia; ne syntyvät kouluttamalla hermoverkkoa. Äskettäinen tehokas sanan upotustoteutus tulee Googlelta nimeltä Word2Vec, jota koulutetaan ennustamalla sanoja, jotka esiintyvät kielen muiden sanojen vieressä. Esimerkiksi sanalle "cat"hermoverkko ennustaa sanat "kitten"ja "feline". Tämä vierekkäisten sanojen intuitio mahdollistaa niiden sijoittamisen vektoriavaruuteen.

Käytännössä käytämme kuitenkin muiden suuryritysten, kuten Googlen, esikoulutettuja malleja prototyyppien nopeaan valmistukseen ja käyttöönottoprosessien yksinkertaistamiseen. Tässä opetusohjelmassa lataamme ja käytämme Googlen Word2Vec valmiiksi koulutettuja sanan upotuksia. Voimme tehdä tämän suorittamalla seuraavan komennon työhakemistossamme.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Pullon ja magnitude-pakettien asentaminen

Lataamamme sanan upotusmalli on .magnitudemuodossa. Tämä muoto mahdollistaa mallin kyselyn tehokkaasti SQL:n avulla ja on siksi optimaalinen upotusmuoto tuotantopalvelimille. Koska meidän on pystyttävä lukemaan .magnitudemuotoa, asennamme pymagnitudepaketin. Asennamme flaskmyös myöhemmin palvelemaan mallin tekemiä syvän oppimisen ennusteita.

pip3 install pymagnitude flask

Lisäämme sen myös riippuvuusseurantaan seuraavalla komennolla. Tämä luo tiedoston nimeltä requirements.txtja tallentaa Python-kirjastomme, jotta voimme asentaa ne uudelleen myöhemmin.

pip3 freeze > requirements.txt

Word2Vec-mallin kysely

Aluksi luomme tiedoston, joka käsittelee sanan upotusten avaamista ja kyselyä.

touch model.py

Seuraavaksi lisäämme seuraavat rivit model.pymagnituden tuontia varten.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Voimme leikkiä pymagnitudepaketin ja syväoppimismallin kanssa käyttämällä querymenetelmää ja tarjoamalla argumentin sanalle.

cat_vector = vectors.query('cat')
print(cat_vector)

Sovellusliittymämme ytimeen määrittelemme funktion, joka palauttaa kahden sanan merkityksen. Tämä on selkäranka useimmille syväoppimisratkaisuille, kuten suositusmoottoreille (eli sisällön näyttämiselle samanlaisilla sanoilla).

Voimme leikkiä tällä toiminnolla käyttämällä similarityja most_similar -funktioita.

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Toteutamme samankaltaisuuslaskimen seuraavasti. Flask API kutsuu tätä menetelmää seuraavassa osiossa. Huomaa, että tämä funktio palauttaa todellisen arvon välillä 0 ja 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

REST API:n luominen

Luomme palvelimemme tiedostoon service.py, jonka sisältö on seuraava. Tuomme flaskja requestkäsittelemme palvelinominaisuuksiamme ja tuomme similaritymoottorin aiemmin kirjoittamastamme moduulista.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Palvelimemme on melko paljas luuta, mutta sitä voidaan helposti laajentaa luomalla lisää reittejä @app.routesisustajalla.

API-puheluiden tekeminen

Voimme käyttää Flask-palvelinta suorittamalla seuraavat komennot aktivoidaksemme virtuaaliympäristömme, asentaaksemme paketit ja suorittaaksemme siihen liittyvän Python-tiedoston.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Palvelimemme on käytettävissä osoitteessa localhost:8000. Voimme tehdä kyselyitä tietokannastamme osoitteessa localhost:8000/similarity?word1=cat&word2=dogja tarkastella vastausta joko selaimessamme tai toisen AJAX-asiakkaan kautta.


Asenna Plesk CentOS 7:ään

Asenna Plesk CentOS 7:ään

Käytätkö erilaista järjestelmää? Plesk on patentoitu verkkoisäntäohjauspaneeli, jonka avulla käyttäjät voivat hallita henkilökohtaisia ​​ja/tai asiakkaidensa verkkosivustoja, tietokantoja

Asenna Cacti Debian Jessielle

Asenna Cacti Debian Jessielle

Johdanto Cacti on avoimen lähdekoodin seuranta- ja grafiikkatyökalu, joka perustuu täysin RRD-tietoihin. Cactin kautta voit seurata lähes minkä tahansa tyyppisiä laitteita

Asenna Lets Encrypt SSL One-Click WordPress -sovellukseen

Asenna Lets Encrypt SSL One-Click WordPress -sovellukseen

Johdanto Lets Encrypt on varmenteen myöntäjäpalvelu, joka tarjoaa ilmaisia ​​TLS/SSL-varmenteita. Certbot yksinkertaistaa asennusprosessia,

Tekkit Classic -palvelimen määrittäminen Ubuntu 16.10:ssä

Tekkit Classic -palvelimen määrittäminen Ubuntu 16.10:ssä

Käytätkö erilaista järjestelmää? Mikä on Tekkit Classic? Tekkit Classic on modack peliin, jonka kaikki tuntevat ja rakastavat; Minecraft. Se sisältää joitain ver

Asenna iRedMail Debian Wheezylle

Asenna iRedMail Debian Wheezylle

Käytätkö erilaista järjestelmää? Tämä opetusohjelma näyttää kuinka asennat ryhmätyöohjelman iRedMail uuteen Debian Wheezy -asennukseen. Sinun pitäisi käyttää tarjoilua

Jekyll-blogin luominen Ubuntuun 16.04

Jekyll-blogin luominen Ubuntuun 16.04

Käytätkö erilaista järjestelmää? Jekyll on loistava vaihtoehto WordPressille bloggaamiseen tai sisällön jakamiseen. Se ei vaadi tietokantoja ja se on erittäin helppoa i

Valvomattomien päivitysten asentaminen Debian 9:ssä (Stretch)

Valvomattomien päivitysten asentaminen Debian 9:ssä (Stretch)

Käytätkö erilaista järjestelmää? Jos ostat Debian-palvelimen, sinulla pitäisi aina olla viimeisimmät tietoturvakorjaukset ja -päivitykset riippumatta siitä, oletko nukkumassa vai ei.

PHP 7.0:n tai PHP 7.1:n asentaminen ja määrittäminen Ubuntu 16.04:ssä

PHP 7.0:n tai PHP 7.1:n asentaminen ja määrittäminen Ubuntu 16.04:ssä

PHP ja siihen liittyvät paketit ovat yleisimmin käytettyjä komponentteja verkkopalvelimen käyttöönotossa. Tässä artikkelissa opimme asentamaan PHP 7.0 tai PHP 7.1 o

Kuinka asentaa Squid Proxy CentOS:ään

Kuinka asentaa Squid Proxy CentOS:ään

Squid on suosittu, ilmainen Linux-ohjelma, jonka avulla voit luoda edelleenlähetysverkkovälityspalvelimen. Tässä oppaassa näet, kuinka Squid asennetaan CentOS:ään kääntääksesi sinut

Lighttpd:n (LLMP Stack) asentaminen CentOS 6:een

Lighttpd:n (LLMP Stack) asentaminen CentOS 6:een

Johdanto Lighttpd on Apachen haarukka, jonka tarkoituksena on olla paljon vähemmän resurssiintensiivinen. Se on kevyt, tästä syystä sen nimi, ja on melko yksinkertainen käyttää. Asenna

Kolme ilmaista palvelinohjauspaneelia (pikaasennus)

Kolme ilmaista palvelinohjauspaneelia (pikaasennus)

1. Virtualmin/Webmin Virtualmin on tehokas ja joustava web-hosting-ohjauspaneeli Linux- ja UNIX-järjestelmille, joka perustuu tunnettuun avoimen lähdekoodin verkkotietokantaan

Yii-sovelluksen määrittäminen Ubuntuun 14.04

Yii-sovelluksen määrittäminen Ubuntuun 14.04

Yii on PHP-kehys, jonka avulla voit kehittää sovelluksia nopeammin ja helpommin. Yiin asentaminen Ubuntuun on yksinkertaista, kuten opit tarkalleen

Näytön käyttö Ubuntu 14.04:ssä

Näytön käyttö Ubuntu 14.04:ssä

Screen on sovellus, joka mahdollistaa usean pääteistuntojen käytön yhdessä ikkunassa. Tämän avulla voit simuloida useita pääteikkunoita, joissa se ma

Asenna oma DNS-palvelin Debianissa/Ubuntussa

Asenna oma DNS-palvelin Debianissa/Ubuntussa

Tämä opetusohjelma selittää, kuinka DNS-palvelin määritetään Bind9:n avulla Debianissa tai Ubuntussa. Korvaa koko artikkelin ajan verkkotunnuksesi-nimi.com vastaavasti. klo th

Logrotaten käyttäminen lokitiedostojen hallintaan

Logrotaten käyttäminen lokitiedostojen hallintaan

Johdanto Logrotate on Linux-apuohjelma, joka yksinkertaistaa lokitiedostojen hallintaa. Se toimii yleensä kerran päivässä cron-työn kautta ja hallitsee lokipohjaa

Staattisen verkon ja IPv6:n määrittäminen CentOS 7:ssä

Staattisen verkon ja IPv6:n määrittäminen CentOS 7:ssä

VULTR on äskettäin tehnyt muutoksia heidän omiinsa, ja kaiken pitäisi nyt toimia hyvin heti, kun NetworkManager on käytössä. Jos haluat poistaa käytöstä

Icinga2:n muokkaaminen käyttämään pää/asiakasmallia CentOS 6:ssa tai CentOS 7:ssä

Icinga2:n muokkaaminen käyttämään pää/asiakasmallia CentOS 6:ssa tai CentOS 7:ssä

Icinga2 on tehokas valvontajärjestelmä, ja master-client-mallissa käytettynä se voi korvata NRPE-pohjaisten valvontatarkastusten tarpeen. Pääasiakas

Asenna Red5 Media Server Ubuntu 16.04:ään

Asenna Red5 Media Server Ubuntu 16.04:ään

Käytätkö erilaista järjestelmää? Red5 on Java-kielellä toteutettu avoimen lähdekoodin mediapalvelin, jonka avulla voit ajaa Flash-monikäyttäjäsovelluksia, kuten suoratoistoa.

Käännä ja asenna Nginx PageSpeed-moduulilla Debian 8:ssa

Käännä ja asenna Nginx PageSpeed-moduulilla Debian 8:ssa

Tässä artikkelissa näemme, kuinka Nginx-päälinja voidaan kääntää ja asentaa virallisista Nginx-lähteistä PageSpeed-moduulilla, jonka avulla voit

Apache Cassandra 3.11.x:n asentaminen Ubuntu 16.04 LTS:ään

Apache Cassandra 3.11.x:n asentaminen Ubuntu 16.04 LTS:ään

Käytätkö erilaista järjestelmää? Apache Cassandra on ilmainen ja avoimen lähdekoodin NoSQL-tietokannan hallintajärjestelmä, joka on suunniteltu tarjoamaan skaalautuvuutta, hig.

Koneiden nousu: tekoälyn todelliset sovellukset

Koneiden nousu: tekoälyn todelliset sovellukset

Tekoäly ei ole tulevaisuudessa, se tässä nykyisyydessä Tässä blogissa Lue kuinka tekoälysovellukset ovat vaikuttaneet eri sektoreihin.

DDOS-hyökkäykset: lyhyt katsaus

DDOS-hyökkäykset: lyhyt katsaus

Oletko myös DDOS-hyökkäysten uhri ja hämmentynyt ehkäisymenetelmistä? Lue tämä artikkeli ratkaistaksesi kysymyksesi.

Oletko koskaan miettinyt, kuinka hakkerit ansaitsevat rahaa?

Oletko koskaan miettinyt, kuinka hakkerit ansaitsevat rahaa?

Olet ehkä kuullut, että hakkerit ansaitsevat paljon rahaa, mutta oletko koskaan miettinyt, kuinka he ansaitsevat tuollaista rahaa? keskustellaan.

Googlen vallankumouksellisia keksintöjä, jotka helpottavat elämääsi.

Googlen vallankumouksellisia keksintöjä, jotka helpottavat elämääsi.

Haluatko nähdä Googlen vallankumouksellisia keksintöjä ja kuinka nämä keksinnöt muuttivat jokaisen ihmisen elämää nykyään? Lue sitten blogia nähdäksesi Googlen keksinnöt.

Essential perjantai: Mitä tekoäly-ohjatuille autoille tapahtui?

Essential perjantai: Mitä tekoäly-ohjatuille autoille tapahtui?

Konsepti itseohjautuvista autoista lähteä tielle tekoälyn avulla on ollut haaveena jo jonkin aikaa. Mutta useista lupauksista huolimatta niitä ei näy missään. Lue tämä blogi saadaksesi lisätietoja…

Teknologinen singulaarisuus: ihmissivilisaation kaukainen tulevaisuus?

Teknologinen singulaarisuus: ihmissivilisaation kaukainen tulevaisuus?

Kun tiede kehittyy nopeasti ja ottaa haltuunsa suuren osan ponnisteluistamme, myös riskit altistaa itsemme selittämättömälle singulariteetille kasvavat. Lue, mitä singulaarisuus voisi tarkoittaa meille.

Tietojen tallennuksen evoluutio – Infografiikka

Tietojen tallennuksen evoluutio – Infografiikka

Tietojen säilytystavat ovat kehittyneet mahdollisesti Datan syntymästä lähtien. Tämä blogi käsittelee tiedon tallennuksen kehitystä infografian pohjalta.

Big Datan referenssiarkkitehtuurikerrosten toiminnot

Big Datan referenssiarkkitehtuurikerrosten toiminnot

Blogista saat tietää Big Data -arkkitehtuurin eri kerroksista ja niiden toiminnoista yksinkertaisimmalla tavalla.

6 uskomatonta etua älykkäiden kotilaitteiden käyttämisestä elämässämme

6 uskomatonta etua älykkäiden kotilaitteiden käyttämisestä elämässämme

Tässä digitaalisessa maailmassa kodin älylaitteista on tullut tärkeä osa elämää. Tässä on muutamia älykkäiden kodin laitteiden hämmästyttäviä etuja, joiden avulla ne tekevät elämästämme elämisen arvoista ja yksinkertaisempaa.

macOS Catalina 10.15.4 -täydennyspäivitys aiheuttaa enemmän ongelmia kuin ratkaiseminen

macOS Catalina 10.15.4 -täydennyspäivitys aiheuttaa enemmän ongelmia kuin ratkaiseminen

Apple julkaisi äskettäin macOS Catalina 10.15.4 -lisäpäivityksen ongelmien korjaamiseksi, mutta näyttää siltä, ​​että päivitys aiheuttaa lisää ongelmia, jotka johtavat mac-koneiden tiilikaamiseen. Lue tämä artikkeli saadaksesi lisätietoja