Jak nainstalovat a používat Apache PredictionIO pro strojové učení na CentOS 7

Předpoklady

Nainstalujte Javu

Nainstalujte PredictionIO

Nainstalujte požadované závislosti

Nakonfigurujte prostředí PredictionIO

Spouštění PredictionIO

Implementace šablony motoru

Zabalit se

Tradiční přístupy k analýze dat nelze použít, když datové sady dosáhnou určité velikosti. Moderní alternativou k analýze obrovských souborů dat je použití metod strojového učení. Strojové učení je schopno produkovat přesné výsledky při použití rychlého a efektivního algoritmu.

Apache PredictionIO je open source server pro strojové učení, který se používá k vytváření prediktivních motorů pro jakýkoli úkol strojového učení. Zkracuje čas aplikace strojového učení z laboratoře do výroby pomocí přizpůsobitelných šablon enginu, které lze rychle sestavit a nasadit. Poskytuje komponenty pro sběr a obsluhu dat a abstrahuje základní technologii k odhalení API, které umožňuje vývojářům soustředit se na transformační komponenty. Jakmile je motorový server PredictionIO nasazen jako webová služba, může reagovat na dynamické dotazy v reálném čase.

Apache PredictionIO se skládá z různých komponent.

Platforma PredictionIO : Open source strojové učení postavené na špičkových aplikacích s otevřeným zdrojovým kódem, jako jsou Apache Spark, Apache Hadoop, Apache HBase a Elasticsearch.
Event Server : Toto nepřetržitě shromažďuje data z vašeho webového serveru nebo mobilního aplikačního serveru v režimu reálného času nebo v dávkovém režimu. Shromážděná data lze použít k trénování motoru nebo k poskytnutí jednotného pohledu pro analýzu dat. Server událostí používá k ukládání dat Apache HBase.
Engine Server : Engine server je zodpovědný za provedení skutečné predikce. Čte trénovací data z úložiště dat a používá jeden nebo více algoritmů strojového učení pro vytváření prediktivních modelů. Jakmile je engine nasazen jako webová služba, odpovídá na dotazy webové nebo mobilní aplikace pomocí REST API nebo SDK.
Galerie šablon : Tato galerie nabízí různé typy předpřipravených šablon enginu. Můžete si vybrat šablonu, která je podobná vašemu případu použití, a upravit ji podle vašich požadavků.

Předpoklady

Instance serveru Vultr CentOS 7 s alespoň 8 GB RAM. Pro účely testování a vývoje si můžete vybrat instanci se 4 GB RAM a další 4 GB odkládací paměti .
Uživatel sudo .

V tomto tutoriálu budeme používat 192.0.2.1jako veřejnou IP adresu serveru. Nahraďte všechny výskyty 192.0.2.1vaší veřejnou IP adresou Vultr.

Aktualizujte svůj základní systém pomocí průvodce Jak aktualizovat CentOS 7 . Jakmile bude váš systém aktualizován, pokračujte v instalaci Javy.

Nainstalujte Javu

Mnoho komponent PredictionIO vyžaduje ke svému fungování JDK nebo Java Development Kit, verze 8. Podporuje OpenJDK a Oracle Java. V tomto tutoriálu nainstalujeme OpenJDK verze 8.

OpenJDK lze snadno nainstalovat, protože balíček je k dispozici ve výchozím úložišti YUM.

sudo yum -y install java-1.8.0-openjdk-devel

Ověřte verzi Java a ujistěte se, že byla správně nainstalována.

java -version

Dostanete podobný výstup.

[user@vultr ~]$ java -version
openjdk version "1.8.0_151"
OpenJDK Runtime Environment (build 1.8.0_151-b12)
OpenJDK 64-Bit Server VM (build 25.151-b12, mixed mode)

Než budeme moci pokračovat dále, budeme muset nastavit proměnné prostředí JAVA_HOMEa JRE_HOME. Najděte absolutní cestu ke spustitelnému souboru JAVA ve vašem systému.

readlink -f $(which java)

Uvidíte podobný výstup.

[user@vultr ~]$ readlink -f $(which java)
/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.151-1.b12.el7_4.x86_64/jre/bin/java

Dalším krokem je nastavení JAVA_HOMEa JRE_HOMEproměnné prostředí v závislosti na cestě adresáři Java.

echo "export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.151-1.b12.el7_4.x86_64" >> ~/.bash_profile
echo "export JRE_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.151-1.b12.el7_4.x86_64/jre" >> ~/.bash_profile

Spusťte bash_profilesoubor.

source ~/.bash_profile

Nyní můžete spustit echo $JAVA_HOMEpříkaz a zkontrolovat, zda je nastavena proměnná prostředí.

[user@vultr ~]$ echo $JAVA_HOME
/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.151-1.b12.el7_4.x86_64

Nainstalujte PredictionIO

Apache poskytuje zdrojové soubory PredictionIO, které lze stáhnout a zkompilovat lokálně. Vytvořte nový dočasný adresář ke stažení a kompilaci zdrojového souboru.

mkdir /tmp/pio_sourcefiles && cd /tmp/pio_sourcefiles

Stáhněte si archiv zdrojového souboru PredictionIO pomocí libovolného webu Apache Mirror .

wget http://apache.mirror.vexxhost.com/incubator/predictionio/0.12.0-incubating/apache-predictionio-0.12.0-incubating.tar.gz

Rozbalte archiv a zkompilujte zdroj, abyste vytvořili distribuci PredictionIO.

tar xf apache-predictionio-0.12.0-incubating.tar.gz
./make-distribution.sh

Výše uvedené rozdělení bude postaven proti výchozí verze závislostí, které jsou Scala 2.11.8, Spark 2.1.1, Hadoop 2.7.3a ElasticSearch 5.5.2. Počkejte na dokončení sestavení, dokončení bude trvat asi deset minut v závislosti na výkonu vašeho systému.

Poznámka : Můžete volně používat nejnovější podporovanou verzi závislostí, ale během sestavování se mohou zobrazit některá varování, protože některé funkce mohou být zastaralé. Spusťte ./make-distribution.sh -Dscala.version=2.11.11 -Dspark.version=2.1.2 -Dhadoop.version=2.7.4 -Delasticsearch.version=5.5.3, nahraďte číslo verze podle svého výběru.

Po úspěšném dokončení sestavení se na konci zobrazí následující zpráva.

...
PredictionIO-0.12.0-incubating/python/pypio/__init__.py
PredictionIO-0.12.0-incubating/python/pypio/utils.py
PredictionIO-0.12.0-incubating/python/pypio/shell.py
PredictionIO binary distribution created at PredictionIO-0.12.0-incubating.tar.gz

Binární soubory PredictionIO budou uloženy do PredictionIO-0.12.0-incubating.tar.gzarchivu. Rozbalte archiv v /optadresáři a poskytněte vlastnictví aktuálnímu uživateli.

sudo tar xf PredictionIO-0.12.0-incubating.tar.gz -C /opt/
sudo chown -R $USER:$USER /opt/PredictionIO-0.12.0-incubating

Nastavte PIO_HOMEproměnnou prostředí.

echo "export PIO_HOME=/opt/PredictionIO-0.12.0-incubating" >> ~/.bash_profile
source ~/.bash_profile

Nainstalujte požadované závislosti

Vytvořte nový adresář pro instalaci závislostí PredictionIO, jako jsou HBase, Sparka Elasticsearch.

mkdir /opt/PredictionIO-0.12.0-incubating/vendors

Stáhněte si Scala verzi 2.11.8 a rozbalte ji do vendorsadresáře.

wget https://downloads.lightbend.com/scala/2.11.8/scala-2.11.8.tgz
tar xf scala-2.11.8.tgz -C /opt/PredictionIO-0.12.0-incubating/vendors

Stáhněte si Apache Hadoop verze 2.7.3 a rozbalte jej do vendorsadresáře.

wget https://archive.apache.org/dist/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz
tar xf hadoop-2.7.3.tar.gz -C /opt/PredictionIO-0.12.0-incubating/vendors

Apache Spark je výchozím procesorem pro PredictionIO. Stáhněte si Spark verzi 2.1.1 a rozbalte jej do vendorsadresáře.

wget https://archive.apache.org/dist/spark/spark-2.1.1/spark-2.1.1-bin-hadoop2.7.tgz
tar xf spark-2.1.1-bin-hadoop2.7.tgz -C /opt/PredictionIO-0.12.0-incubating/vendors

Stáhněte si Elasticsearch verze 5.5.2 a rozbalte jej do vendorsadresáře.

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.2.tar.gz
tar xf elasticsearch-5.5.2.tar.gz -C /opt/PredictionIO-0.12.0-incubating/vendors

Nakonec si stáhněte HBase verze 1.2.6 a rozbalte ji do vendorsadresáře.

wget https://archive.apache.org/dist/hbase/stable/hbase-1.2.6-bin.tar.gz
tar xf hbase-1.2.6-bin.tar.gz -C /opt/PredictionIO-0.12.0-incubating/vendors

Otevřete hbase-site.xmlkonfigurační soubor a nakonfigurujte HBase tak, aby fungovala v samostatném prostředí.

nano /opt/PredictionIO-0.12.0-incubating/vendors/hbase-1.2.6/conf/hbase-site.xml

Najděte prázdný konfigurační blok a nahraďte jej následující konfigurací.

<configuration>
  <property>
    <name>hbase.rootdir</name>
    <value>file:///home/user/PredictionIO-0.12.0-incubating/vendors/hbase-1.2.6/data</value>
  </property>
  <property>
    <name>hbase.zookeeper.property.dataDir</name>
    <value>/home/user/PredictionIO-0.12.0-incubating/vendors/hbase-1.2.6/zookeeper</value>
  </property>
</configuration>

Datový adresář vytvoří automaticky HBase. Upravte soubor prostředí HBase a nastavte JAVA_HOMEcestu.

nano /opt/PredictionIO-0.12.0-incubating/vendors/hbase-1.2.6/conf/hbase-env.sh

Odkomentujte řádek číslo 27 a nastavte JAVA_HOMEcestu k jrevaší instalaci Java. Cestu ke spustitelnému souboru JAVA můžete najít pomocí readlink -f $(which java)příkazu.

# The java implementation to use.  Java 1.7+ required.
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.151-1.b12.el7_4.x86_64/jre

Zakomentujte také řádky 46 a 47, protože pro JAVA 8 nejsou vyžadovány.

# Configure PermSize. Only needed in JDK7. You can safely remove it for JDK8+
# export HBASE_MASTER_OPTS="$HBASE_MASTER_OPTS -XX:PermSize=128m -XX:MaxPermSize=128m"
# export HBASE_REGIONSERVER_OPTS="$HBASE_REGIONSERVER_OPTS -XX:PermSize=128m -XX:MaxPermSize=128m"

Nakonfigurujte prostředí PredictionIO

Výchozí konfigurace v souboru prostředí PredictionIO pio-env.shpředpokládá, že používáme PostgreSQL nebo MySQL. Protože jsme použili HBase a Elasticsearch, budeme muset upravit téměř každou konfiguraci v souboru. Nejlepší je vytvořit zálohu stávajícího souboru a vytvořit nový soubor prostředí PredictionIO.

mv /opt/PredictionIO-0.12.0-incubating/conf/pio-env.sh /opt/PredictionIO-0.12.0-incubating/conf/pio-env.sh.bak

Now create a new file for PredictionIO environment configuration.

nano /opt/PredictionIO-0.12.0-incubating/conf/pio-env.sh

Populate the file with the following configuration.

# PredictionIO Main Configuration
#
# This section controls core behavior of PredictionIO. It is very likely that
# you need to change these to fit your site.

# SPARK_HOME: Apache Spark is a hard dependency and must be configured.
SPARK_HOME=$PIO_HOME/vendors/spark-2.1.1-bin-hadoop2.7

# POSTGRES_JDBC_DRIVER=$PIO_HOME/lib/postgresql-42.0.0.jar
# MYSQL_JDBC_DRIVER=$PIO_HOME/lib/mysql-connector-java-5.1.41.jar

# ES_CONF_DIR: You must configure this if you have advanced configuration for
#              your Elasticsearch setup.
ES_CONF_DIR=$PIO_HOME/vendors/elasticsearch-5.5.2/config

# HADOOP_CONF_DIR: You must configure this if you intend to run PredictionIO
#                  with Hadoop 2.
HADOOP_CONF_DIR=$PIO_HOME/vendors/spark-2.1.1-bin-hadoop2.7/conf

# HBASE_CONF_DIR: You must configure this if you intend to run PredictionIO
#                 with HBase on a remote cluster.
HBASE_CONF_DIR=$PIO_HOME/vendors/hbase-1.2.6/conf

# Filesystem paths where PredictionIO uses as block storage.
PIO_FS_BASEDIR=$HOME/.pio_store
PIO_FS_ENGINESDIR=$PIO_FS_BASEDIR/engines
PIO_FS_TMPDIR=$PIO_FS_BASEDIR/tmp

# PredictionIO Storage Configuration
#
# This section controls programs that make use of PredictionIO's built-in
# storage facilities. Default values are shown below.
#
# For more information on storage configuration please refer to
# http://predictionio.incubator.apache.org/system/anotherdatastore/

# Storage Repositories

# Default is to use PostgreSQL
PIO_STORAGE_REPOSITORIES_METADATA_NAME=pio_meta
PIO_STORAGE_REPOSITORIES_METADATA_SOURCE=ELASTICSEARCH

PIO_STORAGE_REPOSITORIES_EVENTDATA_NAME=pio_event
PIO_STORAGE_REPOSITORIES_EVENTDATA_SOURCE=HBASE

PIO_STORAGE_REPOSITORIES_MODELDATA_NAME=pio_model
PIO_STORAGE_REPOSITORIES_MODELDATA_SOURCE=LOCALFS

# Storage Data Sources

# PostgreSQL Default Settings
# Please change "pio" to your database name in PIO_STORAGE_SOURCES_PGSQL_URL
# Please change PIO_STORAGE_SOURCES_PGSQL_USERNAME and
# PIO_STORAGE_SOURCES_PGSQL_PASSWORD accordingly
# PIO_STORAGE_SOURCES_PGSQL_TYPE=jdbc
# PIO_STORAGE_SOURCES_PGSQL_URL=jdbc:postgresql://localhost/pio
# PIO_STORAGE_SOURCES_PGSQL_USERNAME=pio
# PIO_STORAGE_SOURCES_PGSQL_PASSWORD=pio

# MySQL Example
# PIO_STORAGE_SOURCES_MYSQL_TYPE=jdbc
# PIO_STORAGE_SOURCES_MYSQL_URL=jdbc:mysql://localhost/pio
# PIO_STORAGE_SOURCES_MYSQL_USERNAME=pio
# PIO_STORAGE_SOURCES_MYSQL_PASSWORD=pio

# Elasticsearch Example
PIO_STORAGE_SOURCES_ELASTICSEARCH_TYPE=elasticsearch
PIO_STORAGE_SOURCES_ELASTICSEARCH_HOSTS=localhost
PIO_STORAGE_SOURCES_ELASTICSEARCH_PORTS=9200
PIO_STORAGE_SOURCES_ELASTICSEARCH_SCHEMES=http
PIO_STORAGE_SOURCES_ELASTICSEARCH_CLUSTERNAME=pio
PIO_STORAGE_SOURCES_ELASTICSEARCH_HOME=$PIO_HOME/vendors/elasticsearch-5.5.2

# Optional basic HTTP auth
# PIO_STORAGE_SOURCES_ELASTICSEARCH_USERNAME=my-name
# PIO_STORAGE_SOURCES_ELASTICSEARCH_PASSWORD=my-secret
# Elasticsearch 1.x Example
# PIO_STORAGE_SOURCES_ELASTICSEARCH_TYPE=elasticsearch
# PIO_STORAGE_SOURCES_ELASTICSEARCH_CLUSTERNAME=<elasticsearch_cluster_name>
# PIO_STORAGE_SOURCES_ELASTICSEARCH_HOSTS=localhost
# PIO_STORAGE_SOURCES_ELASTICSEARCH_PORTS=9300
# PIO_STORAGE_SOURCES_ELASTICSEARCH_HOME=$PIO_HOME/vendors/elasticsearch-1.7.6

# Local File System Example
PIO_STORAGE_SOURCES_LOCALFS_TYPE=localfs
PIO_STORAGE_SOURCES_LOCALFS_PATH=$PIO_FS_BASEDIR/models

# HBase Example
PIO_STORAGE_SOURCES_HBASE_TYPE=hbase
PIO_STORAGE_SOURCES_HBASE_HOME=$PIO_HOME/vendors/hbase-1.2.6

# AWS S3 Example
# PIO_STORAGE_SOURCES_S3_TYPE=s3
# PIO_STORAGE_SOURCES_S3_BUCKET_NAME=pio_bucket
# PIO_STORAGE_SOURCES_S3_BASE_PATH=pio_model

Save the file and exit from the editor.

Open the Elasticsearch configuration file.

nano /opt/PredictionIO-0.12.0-incubating/vendors/elasticsearch-5.5.2/config/elasticsearch.yml

Uncomment the line and set the cluster name to exactly the same as the one provided in the PredictionIO environment file. The cluster name is set to pio in the above configuration.

# Use a descriptive name for your cluster:
#
cluster.name: pio

Now add the $PIO_HOME/bin directory into the PATH variable so that the PredictionIO executables are executed directly.

echo "export PATH=$PATH:$PIO_HOME/bin" >> ~/.bash_profile
source ~/.bash_profile

At this point, PredictionIO is successfully installed on your server.

Starting PredictionIO

You can start all the services in PredictionIO such as Elasticsearch, HBase and Event server using a single command.

pio-start-all

You will see the following output.

[user@vultr ~]$ pio-start-all
Starting Elasticsearch...
Starting HBase...
starting master, logging to /opt/PredictionIO-0.12.0-incubating/vendors/hbase-1.2.6/bin/../logs/hbase-user-master-vultr.guest.out
Waiting 10 seconds for Storage Repositories to fully initialize...
Starting PredictionIO Event Server...

Use the following command to check the status of the PredictionIO server.

pio status

You will see the following output.

[user@vultr ~]$ pio status
[INFO] [Management$] Inspecting PredictionIO...
[INFO] [Management$] PredictionIO 0.12.0-incubating is installed at /opt/PredictionIO-0.12.0-incubating
[INFO] [Management$] Inspecting Apache Spark...
[INFO] [Management$] Apache Spark is installed at /opt/PredictionIO-0.12.0-incubating/vendors/spark-2.1.1-bin-hadoop2.7
[INFO] [Management$] Apache Spark 2.1.1 detected (meets minimum requirement of 1.3.0)
[INFO] [Management$] Inspecting storage backend connections...
[INFO] [Storage$] Verifying Meta Data Backend (Source: ELASTICSEARCH)...
[INFO] [Storage$] Verifying Model Data Backend (Source: LOCALFS)...
[INFO] [Storage$] Verifying Event Data Backend (Source: HBASE)...
[INFO] [Storage$] Test writing to Event Store (App Id 0)...
[INFO] [HBLEvents] The namespace pio_event doesn't exist yet. Creating now...
[INFO] [HBLEvents] The table pio_event:events_0 doesn't exist yet. Creating now...
[INFO] [HBLEvents] Removing table pio_event:events_0...
[INFO] [Management$] Your system is all ready to go.

As we can see in the above messages, our system is ready to use for implementing an engine template and predicting data.

Implementing an Engine Template

Several ready to use engine templates are available on the PredictionIO Template Gallery which can be easily installed on the PredictionIO server. You are free to browse through the list of engine templates to find the one that is close to your requirements or you can write your own engine.

In this tutorial, we will implement the E-Commerce Recommendation engine template to demonstrate the functionality of PredictionIO server using some sample data. This engine template provides some personal recommendation to a user in an e-commerce website. By default, it has features such as excluding out of stock items or providing recommendations to a user who signs up after the model is trained. Also, by default, the engine template takes a user's view and buy events, items with categories and properties and list of unavailable items. Once the engine has been trained and deployed, you can send a query with the user id and number of items to be recommended. The generated output will be a ranked list of recommended item ids.

Install Git, as it will be used to clone the repository.

cd ~    
sudo yum -y install git

Clone the E-Commerce Recommender engine template on your system.

git clone https://github.com/apache/incubator-predictionio-template-ecom-recommender.git MyEComRecomm

Create a new application for the E-Commerce Recommendation template engine. Each application in PredictionIO is used to store the data for a separate website. If you have multiple websites, then you can create multiple apps to store each website's data into a different application. You are free to choose any name for your application.

cd MyEComRecomm/
pio app new myecom

You will see the following output.

[user@vultr MyEComRecomm]$ pio app new myecom
[INFO] [HBLEvents] The table pio_event:events_1 doesn't exist yet. Creating now...
[INFO] [App$] Initialized Event Store for this app ID: 1.
[INFO] [Pio$] Created a new app:
[INFO] [Pio$]       Name: myecom
[INFO] [Pio$]         ID: 1
[INFO] [Pio$] Access Key: a_DnDr4uyvjsKRldPoJAFMuPvb-QBz-BhUFyGehXoTKbm89r00Gx4ygnqspTJx4t

The output above also contains the access key which will be used to authenticate when sending the input data to the event server.

You can always find the access key along with the list of available applications by running.

pio app list

You will see the following output containing a list of applications and the access key.

[user@vultr MyEComRecomm]$ pio app list
[INFO] [Pio$]                 Name |   ID |                                                       Access Key | Allowed Event(s)
[INFO] [Pio$]               myecom |    1 | a_DnDr4uyvjsKRldPoJAFMuPvb-QBz-BhUFyGehXoTKbm89r00Gx4ygnqspTJx4t | (all)
[INFO] [Pio$] Finished listing 1 app(s).

Nyní, když jsme vytvořili novou aplikaci, přidáme do ní nějaká data. V produkčním prostředí byste chtěli automaticky odesílat data na server událostí integrací rozhraní API serveru událostí do aplikace. Abychom se dozvěděli, jak PredictionIO funguje, naimportujeme do něj ukázková data. Šablonový engine poskytuje skript Python, který lze snadno použít k importu ukázkových dat na server událostí.

Nainstalujte Python pip.

sudo yum -y install python-pip
sudo pip install --upgrade pip

Nainstalujte PredictionIO Python SDK pomocí pip.

sudo pip install predictionio

Spusťte skript Python a přidejte ukázková data na server událostí.

python data/import_eventserver.py --access_key a_DnDr4uyvjsKRldPoJAFMuPvb-QBz-BhUFyGehXoTKbm89r00Gx4ygnqspTJx4t

Ujistěte se, že jste přístupový klíč nahradili skutečným přístupovým klíčem. Uvidíte podobný výstup.

[user@vultr MyEComRecomm]$ python data/import_eventserver.py --access_key a_DnDr4uyvjsKRldPoJAFMuPvb-QBz-BhUFyGehXoTKbm89r00Gx4ygnqspTJx4t
Namespace(access_key='a_DnDr4uyvjsKRldPoJAFMuPvb-QBz-BhUFyGehXoTKbm89r00Gx4ygnqspTJx4t', url='http://localhost:7070')
{u'status': u'alive'}
Importing data...
('Set user', 'u1')
('Set user', 'u2')

...

('User', 'u10', 'buys item', 'i30')
('User', 'u10', 'views item', 'i40')
('User', 'u10', 'buys item', 'i40')
204 events are imported.

Výše uvedený skript importuje 10 uživatelů, 50 položek v 6 kategoriích a některé náhodné události nákupu a zobrazení. Chcete-li zkontrolovat, zda jsou události importovány nebo ne, můžete spustit následující dotaz.

curl -i -X GET "http://localhost:7070/events.json?accessKey=a_DnDr4uyvjsKRldPoJAFMuPvb-QBz-BhUFyGehXoTKbm89r00Gx4ygnqspTJx4t"

Výstup vám ukáže seznam všech importovaných událostí ve formátu JSON.

Nyní otevřete engine.jsonsoubor v editoru. Tento soubor obsahuje konfiguraci motoru.

nano engine.json

Najděte oba výskyty appNamea nahraďte hodnotu skutečným názvem aplikace, kterou jste vytvořili dříve.

{
  "id": "default",
  "description": "Default settings",
  "engineFactory": "org.example.ecommercerecommendation.ECommerceRecommendationEngine",
  "datasource": {
    "params" : {
      "appName": "myecom"
    }
  },
  "algorithms": [
    {
      "name": "ecomm",
      "params": {
        "appName": "myecom",
        "unseenOnly": true,
        "seenEvents": ["buy", "view"],
        "similarEvents": ["view"],
        "rank": 10,
        "numIterations" : 20,
        "lambda": 0.01,
        "seed": 3
      }
    }
  ]
}

Sestavte aplikaci.

pio build --verbose

Pokud nechcete vidět zprávy protokolu, odeberte --verbosemožnost. První vytvoření šablony motoru zabere několik minut. Po úspěšném dokončení sestavení uvidíte podobný výstup.

[user@vultr MyEComRecomm]$ pio build --verbose
[INFO] [Engine$] Using command '/opt/PredictionIO-0.12.0-incubating/sbt/sbt' at /home/user/MyEComRecomm to build.

...

[INFO] [Engine$] Build finished successfully.
[INFO] [Pio$] Your engine is ready for training.

Nyní trénujte motor. Během tréninku motor analyzuje datovou sadu a trénuje se podle poskytnutého algoritmu.

pio train

Před nasazením aplikace budeme muset otevřít port 8000, aby bylo možné zobrazit stav aplikace na webovém GUI. Také webové stránky a aplikace používající server událostí budou odesílat a přijímat své dotazy prostřednictvím tohoto portu.

sudo firewall-cmd --zone=public --permanent --add-port=8000/tcp
sudo firewall-cmd --reload

Nyní můžete nasadit engine PredictionIO.

pio deploy

Výše uvedený příkaz nasadí motor a vestavěný webový server na port, 8000aby odpovídal na dotazy z webových stránek a aplikací elektronického obchodu. Po úspěšném nasazení motoru uvidíte na konci následující výstup.

[INFO] [HttpListener] Bound to /0.0.0.0:8000
[INFO] [MasterActor] Engine is deployed and running. Engine API is live at http://0.0.0.0:8000.

Stav motoru můžete ověřit http://192.0.2.1:8000pomocí libovolného moderního prohlížeče. Ujistěte se, že nahrazujete 192.0.2.1svou skutečnou IP adresou Vultr.

To znamená, že šablona motoru pro doporučení elektronického obchodu je nasazena a úspěšně spuštěna. u5Spuštěním následujícího dotazu v nové relaci terminálu můžete zadat dotaz na šablonu motoru a načíst pět doporučení pro uživatele .

curl -H "Content-Type: application/json" \
-d '{ "user": "u5", "num": 5 }' \
http://localhost:8000/queries.json

Uvidíte vygenerovaná doporučení pro uživatele u5.

[user@vultr ~]$ curl -H "Content-Type: application/json" \
> -d '{ "user": "u5", "num": 5 }' \
> http://localhost:8000/queries.json
{"itemScores":[{"item":"i25","score":0.9985169366745619},{"item":"i10","score":0.996613946803819},{"item":"i27","score":0.996613946803819},{"item":"i17","score":0.9962796867639341},{"item":"i8","score":0.9955868705972656}]}

Zabalit se

Gratulujeme, Apache PredictionIO byl úspěšně nasazen na váš server. Nyní můžete použít API serveru událostí k importu dat do enginu a předvídat doporučení pro uživatele. Pokud chcete, můžete použít některé další šablony z galerie šablon. Nezapomeňte se podívat na šablonu nástroje Universal Recommender, kterou lze použít téměř ve všech případech použití, včetně elektronického obchodu, zpráv nebo videa.

Tags: #CentOS #Linux Guides #Server Apps

Nainstalujte Plesk na CentOS 7

Používáte jiný systém? Plesk je proprietární ovládací panel webového hostitele, který umožňuje uživatelům spravovat jejich osobní a/nebo klientské webové stránky, databáze

Jak nainstalovat Squid Proxy na CentOS

Squid je populární bezplatný linuxový program, který vám umožňuje vytvořit webový proxy pro předávání. V této příručce uvidíte, jak nainstalovat Squid na CentOS, aby vás otočil

Jak nainstalovat Lighttpd (LLMP Stack) na CentOS 6

Úvod Lighttpd je fork Apache, jehož cílem je být mnohem méně náročný na zdroje. Je lehký, odtud jeho název, a jeho použití je docela jednoduché. Installin

Konfigurace statické sítě a IPv6 na CentOS 7

VULTR nedávno provedl změny na jejich konci a vše by nyní mělo fungovat dobře po vybalení s povoleným NetworkManagerem. Pokud si přejete deaktivovat

Úprava Icinga2 pro použití modelu Master/Client na CentOS 6 nebo CentOS 7

Icinga2 je výkonný monitorovací systém a při použití v modelu master-client může nahradit potřebu monitorovacích kontrol založených na NRPE. Hlavní klient

Jak nainstalovat Apache Cassandra 3.11.x na CentOS 7

Používáte jiný systém? Apache Cassandra je bezplatný a otevřený systém pro správu databází NoSQL, který je navržen tak, aby poskytoval škálovatelnost, vysokou

Jak nainstalovat Microweber na CentOS 7

Používáte jiný systém? Microweber je open source drag and drop CMS a online obchod. Zdrojový kód Microweber je hostován na GitHubu. Tento průvodce vám to ukáže

Jak nainstalovat Vanilla Forum na CentOS 7

Používáte jiný systém? Vanilla forum je open source aplikace fóra napsaná v PHP. Je plně přizpůsobitelný, snadno použitelný a podporuje externí

Jak nainstalovat Mattermost 4.1 na CentOS 7

Používáte jiný systém? Mattermost je open source alternativa k zasílání zpráv Slack SAAS s vlastním hostitelem. Jinými slovy, s Mattermostem můžete ca

Vytvoření sítě serverů Minecraft pomocí BungeeCord na Debian 8, Debian 9 nebo CentOS 7

Co budete potřebovat Vultr VPS s alespoň 1 GB RAM. Přístup SSH (s oprávněními root/administrátor). Krok 1: Instalace BungeeCord První věci

Umožňuje šifrovat na Plesku

Ovládací panel Plesk se vyznačuje velmi pěknou integrací pro Lets Encrypt. Lets Encrypt je jedním z jediných poskytovatelů SSL, kteří rozdávají kompletní certifikáty

Umožňuje šifrovat na cPanel

Lets Encrypt je certifikační autorita určená k bezplatnému poskytování certifikátů SSL. cPanel vytvořil úhlednou integraci, takže vy a váš klient

Jak nainstalovat Concrete5 na CentOS 7

Používáte jiný systém? Concrete5 je open source CMS, který nabízí mnoho charakteristických a užitečných funkcí, které pomáhají editorům snadno vytvářet obsah

Jak nainstalovat kontrolní panel na CentOS 7

Používáte jiný systém? Review Board je bezplatný a open source nástroj pro kontrolu zdrojového kódu, dokumentace, obrázků a mnoha dalších. Je to webový software

Nastavte ověřování HTTP pomocí Nginx na CentOS 7

V této příručce se dozvíte, jak nastavit HTTP ověřování pro webový server Nginx běžící na CentOS 7. Požadavky Chcete-li začít, budete potřebovat

Jak nainstalovat YOURLS na CentOS 7

YOURLS (Your Own URL Shortener) je open source aplikace pro zkracování adres URL a analýzu dat. V tomto článku se budeme zabývat procesem instalace

Jak nainstalovat a nakonfigurovat ArangoDB na CentOS 7

Používáte jiný systém? Úvod ArangoDB je open source databáze NoSQL s flexibilním datovým modelem pro dokumenty, grafy a páry klíč–hodnota. to je

Použití Etckeeper pro správu verzí /etc

Úvod Adresář /etc/ hraje kritickou roli ve způsobu fungování systému Linux. Důvodem je skutečnost, že téměř každá konfigurace systému

Proč byste měli používat SSHFS? Jak připojit vzdálený souborový systém s SSHFS na CentOS 6

Mnoho systémových administrátorů spravuje velké množství serverů. Když je potřeba přistupovat k souborům přes různé servery, přihlaste se ke každému zvlášť ca

Nastavení serveru Half Life 2 na CentOS 6

Tento návod pokryje proces instalace herního serveru Half Life 2 na systém CentOS 6. Krok 1: Instalace předpokladů Aby bylo možné nastavit ou

The Rise of Machines: Real World Applications of AI

Umělá inteligence není v budoucnosti, je zde přímo v současnosti V tomto blogu si přečtěte, jak aplikace umělé inteligence ovlivnily různé sektory.

Útoky DDOS: Stručný přehled

Jste také obětí DDOS útoků a nemáte jasno v metodách prevence? Chcete-li vyřešit své dotazy, přečtěte si tento článek.

Přemýšleli jste někdy, jak hackeři vydělávají peníze?

Možná jste slyšeli, že hackeři vydělávají spoustu peněz, ale napadlo vás někdy, jak takové peníze vydělávají? Pojďme diskutovat.

Revoluční vynálezy od Googlu, které vám usnadní život.

Chcete vidět revoluční vynálezy Google a jak tyto vynálezy změnily život každého dnešního člověka? Pak si přečtěte na blogu a podívejte se na vynálezy od Googlu.

Friday Essential: Co se stalo s auty řízenými umělou inteligencí?

Koncept aut s vlastním pohonem, která vyrazí na silnice s pomocí umělé inteligence, je snem, který už nějakou dobu máme. Ale přes několik slibů nejsou nikde vidět. Přečtěte si tento blog a dozvíte se více…

Technologická singularita: vzdálená budoucnost lidské civilizace?

Jak se věda vyvíjí rychlým tempem a přebírá mnoho našeho úsilí, stoupá také riziko, že se vystavíme nevysvětlitelné singularitě. Přečtěte si, co pro nás může znamenat singularita.

Evoluce ukládání dat – Infografika

Způsoby ukládání dat se mohou vyvíjet od narození dat. Tento blog se zabývá vývojem ukládání dat na základě infografiky.

Funkcionality vrstev referenční architektury velkých dat

Přečtěte si blog, abyste co nejjednodušším způsobem poznali různé vrstvy v architektuře velkých dat a jejich funkce.

6 úžasných výhod toho, že máme v životě zařízení pro chytrou domácnost

V tomto digitálním světě se chytrá domácí zařízení stala klíčovou součástí života. Zde je několik úžasných výhod chytrých domácích zařízení o tom, jak náš život stojí za to žít a zjednodušit jej.

Aktualizace doplňku macOS Catalina 10.15.4 způsobuje více problémů než řešení

Apple nedávno vydal doplňkovou aktualizaci macOS Catalina 10.15.4, která opravuje problémy, ale zdá se, že aktualizace způsobuje další problémy, které vedou k zablokování počítačů mac. Přečtěte si tento článek a dozvíte se více

We use cookies to improve your experience.
By continuing, you acknowledge that you have read and understand our Cookie Policy. Accept

Jak nainstalovat a používat Apache PredictionIO pro strojové učení na CentOS 7

Předpoklady

Nainstalujte Javu

Nainstalujte PredictionIO

Nainstalujte požadované závislosti

Nakonfigurujte prostředí PredictionIO

Starting PredictionIO

Implementing an Engine Template

Zabalit se

Leave a Comment

Nainstalujte Plesk na CentOS 7

Jak nainstalovat Squid Proxy na CentOS

Jak nainstalovat Lighttpd (LLMP Stack) na CentOS 6

Konfigurace statické sítě a IPv6 na CentOS 7

Úprava Icinga2 pro použití modelu Master/Client na CentOS 6 nebo CentOS 7

Jak nainstalovat Apache Cassandra 3.11.x na CentOS 7

Jak nainstalovat Microweber na CentOS 7

Jak nainstalovat Vanilla Forum na CentOS 7

Jak nainstalovat Mattermost 4.1 na CentOS 7

Vytvoření sítě serverů Minecraft pomocí BungeeCord na Debian 8, Debian 9 nebo CentOS 7

Umožňuje šifrovat na Plesku

Umožňuje šifrovat na cPanel

Jak nainstalovat Concrete5 na CentOS 7

Jak nainstalovat kontrolní panel na CentOS 7

Nastavte ověřování HTTP pomocí Nginx na CentOS 7

Jak nainstalovat YOURLS na CentOS 7

Jak nainstalovat a nakonfigurovat ArangoDB na CentOS 7

Použití Etckeeper pro správu verzí /etc

Proč byste měli používat SSHFS? Jak připojit vzdálený souborový systém s SSHFS na CentOS 6

Nastavení serveru Half Life 2 na CentOS 6

The Rise of Machines: Real World Applications of AI

Útoky DDOS: Stručný přehled

Přemýšleli jste někdy, jak hackeři vydělávají peníze?

Revoluční vynálezy od Googlu, které vám usnadní život.

Friday Essential: Co se stalo s auty řízenými umělou inteligencí?

Technologická singularita: vzdálená budoucnost lidské civilizace?

Evoluce ukládání dat – Infografika

Funkcionality vrstev referenční architektury velkých dat

6 úžasných výhod toho, že máme v životě zařízení pro chytrou domácnost

Aktualizace doplňku macOS Catalina 10.15.4 způsobuje více problémů než řešení