Ako vytvoriť hlboké učenie REST API s Word2Vec a Flask

Tradičné prístupy k vývoju sa ťažko udržujú pri použití zložitých modelov strojového učenia vo výrobe. Vývoj na prenosnom počítači alebo lokálnom počítači môže byť pomalý na trénovanie modelu strojového učenia pre inžinierov hlbokého učenia. V dôsledku toho zvyčajne využívame cloudové stroje s výkonnejším hardvérom na trénovanie a spúšťanie našich modelov strojového učenia. Toto je dobrá prax, pretože abstrahujeme zložité výpočty a namiesto toho podľa potreby vytvárame požiadavky AJAX. V tomto návode sprístupníme predtrénovaný model hlbokého učenia s názvom Word2Vec ďalším službám vytvorením REST API od základov.

Predpoklady

  • Inštancia servera Ubuntu 16.04 s najmenej 4 GB RAM. Na účely testovania a vývoja si môžete vybrať inštanciu so 4 GB RAM
  • Pochopenie toho, ako používať operačný systém Linux na vytváranie/navigáciu/úpravu priečinkov a súborov
  • sudoužívateľ

Čo sú vkladanie slov?

Vkladanie slov je nedávny vývoj v oblasti spracovania prirodzeného jazyka a hlbokého učenia, ktorý spôsobil revolúciu v oboch oblastiach vďaka rýchlemu pokroku. Vložené slová sú v podstate vektory, z ktorých každý zodpovedá jednému slovu, takže vektory znamenajú slová. To možno demonštrovať určitými javmi, ako je napríklad vektor pre king - queen = boy - girl. Slovné vektory sa používajú na zostavenie všetkého od odporúčacích nástrojov až po chatovacie roboty, ktoré skutočne rozumejú anglickému jazyku.

Vloženie slov nie je náhodné; vznikajú trénovaním neurónovej siete. Nedávna výkonná implementácia vkladania slov pochádza od spoločnosti Google s názvom Word2Vec, ktorá je trénovaná predpovedaním slov, ktoré sa objavujú vedľa iných slov v jazyku. Napríklad pre slovo "cat"neurónová sieť predpovedá slová "kitten"a "feline". Táto intuícia slov vyskytujúcich sa blízko seba nám umožňuje umiestniť ich do vektorového priestoru.

V praxi však máme tendenciu používať vopred pripravené modely iných veľkých korporácií, ako je Google, aby sme rýchlo vytvorili prototyp a zjednodušili procesy nasadenia. V tomto návode si stiahneme a použijeme vopred natrénované vloženie slov Word2Vec od Google. Môžeme to urobiť spustením nasledujúceho príkazu v našom pracovnom adresári.

wget http://magnitude.plasticity.ai/word2vec/GoogleNews-vectors-negative300.magnitude

Inštalácia balíkov Flask a Magnitude

Model vkladania slov, ktorý sme stiahli, je vo .magnitudeformáte. Tento formát nám umožňuje efektívne dopytovať model pomocou SQL, a preto je optimálnym formátom na vkladanie pre produkčné servery. Keďže musíme vedieť čítať .magnitudeformát, nainštalujeme pymagnitudebalík. Nainštalujeme tiež, flaskaby sme neskôr slúžili na predpovede hlbokého učenia vytvorené modelom.

pip3 install pymagnitude flask

Tiež ho pridáme do nášho nástroja na sledovanie závislostí pomocou nasledujúceho príkazu. Tým sa vytvorí súbor s názvom requirements.txta uloží sa naše knižnice Python, aby sme ich mohli neskôr znova nainštalovať.

pip3 freeze > requirements.txt

Dopyt na model Word2Vec

Na začiatok vytvoríme súbor, ktorý zvládne otváranie a dopytovanie slov vloženia.

touch model.py

Ďalej pridáme nasledujúce riadky model.pyna importovanie Magnitude.

from pymagnitude import Magnitude
vectors = Magnitude('GoogleNews-vectors-negative300.magnitude')

Môžeme sa pohrať s pymagnitudebalíkom a modelom hlbokého učenia pomocou querymetódy, ktorá poskytuje argument pre slovo.

cat_vector = vectors.query('cat')
print(cat_vector)

Pre jadro nášho API zadefinujeme funkciu, ktorá vráti rozdiel vo význame medzi dvoma slovami. Toto je chrbtica pre väčšinu riešení pre hlboké učenie pre veci, ako sú nástroje odporúčaní (tj zobrazovanie obsahu s podobnými slovami).

S touto funkciou sa môžeme pohrať pomocou funkcií similaritya most_similar .

print(vectors.similarity("cat", "dog"))
print(vectors.most_similar("cat", topn=100))

Kalkulátor podobnosti implementujeme nasledovne. Túto metódu zavolá Flask API v ďalšej časti. Všimnite si, že táto funkcia vracia skutočnú hodnotu medzi 0 a 1.

def similarity(word1, word2):
    return vectors.similarity(word1, word2)

Vytvorenie REST API

Náš server vytvoríme v súbore service.pys nasledujúcim obsahom. Importujeme flaska requestspracovávame naše funkcie servera a importujeme similarityengine z modulu, ktorý sme napísali predtým.

from flask import Flask, request
from model import similarity

app = Flask(__name__)

@app.route("/", methods=['GET'])
def welcome():
    return "Welcome to our Machine Learning REST API!"

@app.route("/similarity", methods=['GET'])
def similarity_route():
    word1 = request.args.get("word1")
    word2 = request.args.get("word2")
    return str(similarity(word1, word2))

if __name__ == "__main__":
    app.run(port=8000, debug=True)

Náš server je skôr holý, ale dá sa ľahko rozšíriť vytvorením viacerých trás pomocou @app.routedekorátora.

Uskutočňovanie volaní API

Náš server Flask môžeme spustiť spustením nasledujúcich príkazov na aktiváciu nášho virtuálneho prostredia, inštaláciu našich balíkov a spustenie súvisiaceho súboru Python.

source venv/bin/activate
pip3 install -r requirements.txt
python3 service.py

Náš server bude dostupný na adrese localhost:8000. Môžeme vyhľadávať v našej databáze localhost:8000/similarity?word1=cat&word2=doga zobraziť odpoveď buď v našom prehliadači alebo prostredníctvom iného klienta AJAX.

Zanechať komentár

The Rise of Machines: Real World Applications of AI

The Rise of Machines: Real World Applications of AI

Umelá inteligencia nie je v budúcnosti, je tu priamo v súčasnosti V tomto blogu si prečítajte, ako aplikácie umelej inteligencie ovplyvnili rôzne sektory.

Útoky DDOS: Stručný prehľad

Útoky DDOS: Stručný prehľad

Ste aj vy obeťou DDOS útokov a máte zmätok ohľadom metód prevencie? Ak chcete vyriešiť svoje otázky, prečítajte si tento článok.

Zaujímalo vás niekedy, ako hackeri zarábajú peniaze?

Zaujímalo vás niekedy, ako hackeri zarábajú peniaze?

Možno ste už počuli, že hackeri zarábajú veľa peňazí, ale premýšľali ste niekedy nad tým, ako môžu zarábať také peniaze? poďme diskutovať.

Revolučné vynálezy od spoločnosti Google, ktoré vám uľahčia život.

Revolučné vynálezy od spoločnosti Google, ktoré vám uľahčia život.

Chcete vidieť revolučné vynálezy od Google a ako tieto vynálezy zmenili život každého dnešného človeka? Potom si prečítajte na blogu a pozrite si vynálezy spoločnosti Google.

Piatok Essential: Čo sa stalo s autami poháňanými AI?

Piatok Essential: Čo sa stalo s autami poháňanými AI?

Koncept samoriadených áut vyraziť na cesty s pomocou umelej inteligencie je snom, ktorý máme už nejaký čas. Ale napriek niekoľkým prísľubom ich nikde nevidno. Prečítajte si tento blog a dozviete sa viac…

Technologická singularita: vzdialená budúcnosť ľudskej civilizácie?

Technologická singularita: vzdialená budúcnosť ľudskej civilizácie?

Ako sa veda vyvíja rýchlym tempom a preberá veľa nášho úsilia, zvyšuje sa aj riziko, že sa vystavíme nevysvetliteľnej singularite. Prečítajte si, čo pre nás môže znamenať singularita.

Funkcionality vrstiev referenčnej architektúry veľkých dát

Funkcionality vrstiev referenčnej architektúry veľkých dát

Prečítajte si blog, aby ste čo najjednoduchším spôsobom spoznali rôzne vrstvy architektúry veľkých dát a ich funkcie.

Vývoj ukladania dát – Infografika

Vývoj ukladania dát – Infografika

Spôsoby ukladania údajov sa môžu vyvíjať už od zrodu údajov. Tento blog sa zaoberá vývojom ukladania údajov na základe infografiky.

6 úžasných výhod toho, že máme v živote inteligentné domáce zariadenia

6 úžasných výhod toho, že máme v živote inteligentné domáce zariadenia

V tomto digitálnom svete sa inteligentné domáce zariadenia stali kľúčovou súčasťou života. Tu je niekoľko úžasných výhod inteligentných domácich zariadení o tom, ako robia náš život, ktorý stojí za to žiť, a ktorý zjednodušujú.

Aktualizácia doplnku macOS Catalina 10.15.4 spôsobuje viac problémov, ako ich rieši

Aktualizácia doplnku macOS Catalina 10.15.4 spôsobuje viac problémov, ako ich rieši

Spoločnosť Apple nedávno vydala doplnkovú aktualizáciu macOS Catalina 10.15.4 na opravu problémov, ale zdá sa, že táto aktualizácia spôsobuje ďalšie problémy, ktoré vedú k blokovaniu počítačov Mac. Prečítajte si tento článok a dozviete sa viac