Hur man installerar Hadoop i fristående läge på CentOS 7

Apache Hadoop är ett verktyg för bearbetning av Big Data med öppen källkod, som används ofta inom IT-branschen.

Beroende på storlek, typ och skala på dina data kan du distribuera Hadoop i fristående eller klusterläge.

I denna nybörjarfokuserade handledning kommer vi att installera Hadoop i fristående läge på en CentOS 7-serverinstans.

Förutsättningar

Steg 1: Uppdatera systemet

Logga in som sudo-användare och uppdatera sedan CentOS 7-systemet till den senaste stabila statusen:

sudo yum install epel-release -y
sudo yum update -y
sudo shutdown -r now

När servern är online loggar du in igen.

Steg 2: Installera Java

Hadoop är Java-baserat och OpenJDK 8 är den rekommenderade versionen för den senaste stabila versionen.

Installera OpenJDK 8 JRE med YUM:

sudo yum install -y java-1.8.0-openjdk

Verifiera installationen av OpenJDK 8 JRE:

java -version

Utgången ska likna:

openjdk version "1.8.0_111"
OpenJDK Runtime Environment (build 1.8.0_111-b15)
OpenJDK 64-Bit Server VM (build 25.111-b15, mixed mode)

Steg 3: Installera Hadoop

Du kan alltid hitta nedladdningsadressen till den senaste versionen av Hadoop från den officiella versionen av Apache Hadoop . När denna artikel skrevs är den senaste stabila versionen av Hadoop 2.7.3.

Ladda ner det binära arkivet för Hadoop 2.7.3:

cd
wget http://www-us.apache.org/dist/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

Ladda ner den matchande kontrollsummafilen:

wget https://dist.apache.org/repos/dist/release/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz.mds

Installera kontrollsummeverktyget:

sudo yum install perl-Digest-SHA

Beräkna SHA256-värdet för Hadoop-arkivet:

shasum -a 256 hadoop-2.7.3.tar.gz

Visa innehållet i filen hadoop-2.7.3.tar.gz.mdsoch se till att de två SHA256-värdena är identiska:

cat hadoop-2.7.3.tar.gz.mds

Packa upp arkivet till en angiven plats:

sudo tar -zxvf hadoop-2.7.3.tar.gz -C /opt

Innan du kan köra Hadoop ordentligt måste du ange Java-hemplatsen för den.

Öppna Hadoop-miljöns konfigurationsfil /opt/hadoop-2.7.3/etc/hadoop/hadoop-env.shmed vieller din favorittextredigerare:

sudo vi /opt/hadoop-2.7.3/etc/hadoop/hadoop-env.sh

Hitta raden:

export JAVA_HOME=$

Byt ut den mot:

export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::")

Den här inställningen gör att Hadoop alltid använder standardinstallationsplatsen för Java.

Spara och avsluta:

:wq!

Du kan lägga till Hadoop-programmets sökväg till PATHmiljövariabeln för din bekvämlighet:

echo "export PATH=/opt/hadoop-2.7.3/bin:$PATH" | sudo tee -a /etc/profile
source /etc/profile

Steg 4: Kör och testa Hadoop

Kör helt enkelt kommandot hadoopså kommer du att bli tillfrågad om användningen av kommandot hadoop och dess olika parametrar.

Här kan du använda ett inbyggt exempel för att testa din Hadoop-installation.

Förbered datakällan:

mkdir ~/source
cp /opt/hadoop-2.7.3/etc/hadoop/*.xml ~/source

Använd Hadoop tillsammans med grep för att mata ut resultatet:

hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep ~/source ~/output 'principal[.]*'

Utgången bör vara:

    ...
    File System Counters
            FILE: Number of bytes read=1247812
            FILE: Number of bytes written=2336462
            FILE: Number of read operations=0
            FILE: Number of large read operations=0
            FILE: Number of write operations=0
    Map-Reduce Framework
            Map input records=2
            Map output records=2
            Map output bytes=37
            Map output materialized bytes=47
            Input split bytes=117
            Combine input records=0
            Combine output records=0
            Reduce input groups=2
            Reduce shuffle bytes=47
            Reduce input records=2
            Reduce output records=2
            Spilled Records=4
            Shuffled Maps =1
            Failed Shuffles=0
            Merged Map outputs=1
            GC time elapsed (ms)=24
            Total committed heap usage (bytes)=262758400
    Shuffle Errors
            BAD_ID=0
            CONNECTION=0
            IO_ERROR=0
            WRONG_LENGTH=0
            WRONG_MAP=0
            WRONG_REDUCE=0
    File Input Format Counters
            Bytes Read=151
    File Output Format Counters
            Bytes Written=37

Slutligen kan du se innehållet i utdatafilerna:

cat ~/output/*

Resultatet bör bli:

6       principal
1       principal.

Du är nu redo att utforska Hadoop.

Lämna en kommentar

The Rise of Machines: Real World Applications of AI

The Rise of Machines: Real World Applications of AI

Artificiell intelligens är inte i framtiden, det är här i nuet I den här bloggen Läs hur Artificiell intelligens-applikationer har påverkat olika sektorer.

DDOS-attacker: En kort översikt

DDOS-attacker: En kort översikt

Är du också ett offer för DDOS-attacker och förvirrad över de förebyggande metoderna? Läs den här artikeln för att lösa dina frågor.

Har du någonsin undrat hur hackare tjänar pengar?

Har du någonsin undrat hur hackare tjänar pengar?

Du kanske har hört att hackare tjänar mycket pengar, men har du någonsin undrat hur de tjänar den typen av pengar? låt oss diskutera.

Revolutionerande uppfinningar från Google som gör ditt liv lätt.

Revolutionerande uppfinningar från Google som gör ditt liv lätt.

Vill du se revolutionerande uppfinningar av Google och hur dessa uppfinningar förändrade livet för varje människa idag? Läs sedan till bloggen för att se uppfinningar av Google.

Fredag ​​Essential: Vad hände med AI-drivna bilar?

Fredag ​​Essential: Vad hände med AI-drivna bilar?

Konceptet med att självkörande bilar ska ut på vägarna med hjälp av artificiell intelligens är en dröm vi har ett tag nu. Men trots flera löften finns de ingenstans att se. Läs den här bloggen för att lära dig mer...

Technological Singularity: A Distant Future of Human Civilization?

Technological Singularity: A Distant Future of Human Civilization?

När vetenskapen utvecklas i snabb takt och tar över en hel del av våra ansträngningar, ökar också riskerna för att utsätta oss för en oförklarlig singularitet. Läs, vad singularitet kan betyda för oss.

Funktioner för Big Data Reference Architecture Layers

Funktioner för Big Data Reference Architecture Layers

Läs bloggen för att känna till olika lager i Big Data Architecture och deras funktionaliteter på enklaste sätt.

Utveckling av datalagring – Infographic

Utveckling av datalagring – Infographic

Lagringsmetoderna för data har utvecklats kan vara sedan födelsen av data. Den här bloggen tar upp utvecklingen av datalagring på basis av en infografik.

6 fantastiska fördelar med att ha smarta hemenheter i våra liv

6 fantastiska fördelar med att ha smarta hemenheter i våra liv

I denna digitala värld har smarta hemenheter blivit en avgörande del av livet. Här är några fantastiska fördelar med smarta hemenheter om hur de gör vårt liv värt att leva och enklare.

macOS Catalina 10.15.4 tilläggsuppdatering orsakar fler problem än att lösa

macOS Catalina 10.15.4 tilläggsuppdatering orsakar fler problem än att lösa

Nyligen släppte Apple macOS Catalina 10.15.4, en tilläggsuppdatering för att åtgärda problem, men det verkar som om uppdateringen orsakar fler problem som leder till att mac-datorer blir murade. Läs den här artikeln för att lära dig mer