Како инсталирати Хадооп у самосталном режиму на ЦентОС 7

Апацхе Хадооп је алат за обраду великих података отвореног кода, који се широко користи у ИТ индустрији.

У зависности од величине, типа и размере ваших података, можете да примените Хадооп у самосталном или кластер режиму.

У овом водичу намењеном почетницима, ми ћемо инсталирати Хадооп у самосталном режиму на инстанци сервера ЦентОС 7.

Предуслови

Корак 1: Ажурирајте систем

Пријавите се као судо корисник, а затим ажурирајте систем ЦентОС 7 на најновији стабилан статус:

sudo yum install epel-release -y
sudo yum update -y
sudo shutdown -r now

Када је сервер на мрежи, поново се пријавите.

Корак 2: Инсталирајте Јава

Хадооп је заснован на Јави и ОпенЈДК 8 је препоручена верзија за најновију стабилну верзију.

Инсталирајте ОпенЈДК 8 ЈРЕ користећи ИУМ:

sudo yum install -y java-1.8.0-openjdk

Проверите инсталацију ОпенЈДК 8 ЈРЕ:

java -version

Излаз би требало да личи на:

openjdk version "1.8.0_111"
OpenJDK Runtime Environment (build 1.8.0_111-b15)
OpenJDK 64-Bit Server VM (build 25.111-b15, mixed mode)

Корак 3: Инсталирајте Хадооп

УРЛ за преузимање најновије верзије Хадооп-а увек можете пронаћи са званичне странице издања Апацхе Хадооп-а . У време писања овог чланка, најновија стабилна верзија Хадооп-а је 2.7.3.

Преузмите бинарну архиву Хадооп-а 2.7.3:

cd
wget http://www-us.apache.org/dist/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

Преузмите одговарајућу датотеку контролне суме:

wget https://dist.apache.org/repos/dist/release/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz.mds

Инсталирајте алатку за проверу:

sudo yum install perl-Digest-SHA

Израчунајте СХА256 вредност Хадооп архиве:

shasum -a 256 hadoop-2.7.3.tar.gz

Прикажите садржај датотеке hadoop-2.7.3.tar.gz.mdsи уверите се да су две СХА256 вредности идентичне:

cat hadoop-2.7.3.tar.gz.mds

Распакујте архиву на назначену локацију:

sudo tar -zxvf hadoop-2.7.3.tar.gz -C /opt

Пре него што будете могли да правилно покренете Хадооп, морате да наведете почетну локацију Јаве за њега.

Отворите конфигурациону датотеку Хадооп окружења /opt/hadoop-2.7.3/etc/hadoop/hadoop-env.shкористећи viили ваш омиљени уређивач текста:

sudo vi /opt/hadoop-2.7.3/etc/hadoop/hadoop-env.sh

Пронађите линију:

export JAVA_HOME=$

Замените га са:

export JAVA_HOME=$(readlink -f /usr/bin/java | sed "s:bin/java::")

Ова поставка ће учинити да Хадооп увек користи подразумевану локацију за инсталацију Јаве.

Сачувај и затвори:

:wq!

Можете додати путању Хадооп програма у PATHпроменљиву окружења ради ваше удобности:

echo "export PATH=/opt/hadoop-2.7.3/bin:$PATH" | sudo tee -a /etc/profile
source /etc/profile

Корак 4: Покрените и тестирајте Хадооп

Једноставно извршите команду hadoopи од вас ће бити затражено коришћење команде хадооп и њених различитих параметара.

Овде можете користити уграђени пример да тестирате своју Хадооп инсталацију.

Припремите извор података:

mkdir ~/source
cp /opt/hadoop-2.7.3/etc/hadoop/*.xml ~/source

Користите Хадооп заједно са греп да бисте добили резултат:

hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep ~/source ~/output 'principal[.]*'

Излаз би требао бити:

    ...
    File System Counters
            FILE: Number of bytes read=1247812
            FILE: Number of bytes written=2336462
            FILE: Number of read operations=0
            FILE: Number of large read operations=0
            FILE: Number of write operations=0
    Map-Reduce Framework
            Map input records=2
            Map output records=2
            Map output bytes=37
            Map output materialized bytes=47
            Input split bytes=117
            Combine input records=0
            Combine output records=0
            Reduce input groups=2
            Reduce shuffle bytes=47
            Reduce input records=2
            Reduce output records=2
            Spilled Records=4
            Shuffled Maps =1
            Failed Shuffles=0
            Merged Map outputs=1
            GC time elapsed (ms)=24
            Total committed heap usage (bytes)=262758400
    Shuffle Errors
            BAD_ID=0
            CONNECTION=0
            IO_ERROR=0
            WRONG_LENGTH=0
            WRONG_MAP=0
            WRONG_REDUCE=0
    File Input Format Counters
            Bytes Read=151
    File Output Format Counters
            Bytes Written=37

Коначно, можете погледати садржај излазних датотека:

cat ~/output/*

Резултат би требао бити:

6       principal
1       principal.

Сада сте спремни да истражите Хадооп.

Остави коментар

Успон машина: Примене вештачке интелигенције у стварном свету

Успон машина: Примене вештачке интелигенције у стварном свету

Вештачка интелигенција није у будућности, она је овде управо у садашњости. У овом блогу Прочитајте како су апликације вештачке интелигенције утицале на различите секторе.

ДДОС напади: кратак преглед

ДДОС напади: кратак преглед

Да ли сте и ви жртва ДДОС напада и збуњени сте методама превенције? Прочитајте овај чланак да бисте решили своја питања.

Да ли сте се икада запитали како хакери зарађују новац?

Да ли сте се икада запитали како хакери зарађују новац?

Можда сте чули да хакери зарађују много новца, али да ли сте се икада запитали како зарађују толики новац? Хајде да причамо.

Гоогле-ови револуционарни изуми који ће вам олакшати живот.

Гоогле-ови револуционарни изуми који ће вам олакшати живот.

Да ли желите да видите револуционарне изуме Гугла и како су ти изуми променили живот сваког људског бића данас? Затим читајте на блогу да бисте видели Гооглеове изуме.

Фридаи Ессентиал: Шта се десило са аутомобилима које покреће вештачка интелигенција?

Фридаи Ессентиал: Шта се десило са аутомобилима које покреће вештачка интелигенција?

Концепт самовозећих аутомобила који путују на путеве уз помоћ вештачке интелигенције је сан који већ неко време имамо. Али упркос неколико обећања, њих нема нигде. Прочитајте овај блог да сазнате више…

Технолошка сингуларност: далека будућност људске цивилизације?

Технолошка сингуларност: далека будућност људске цивилизације?

Како се наука развија великом брзином, преузимајући многе наше напоре, расте и ризик да се подвргнемо необјашњивој сингуларности. Прочитајте шта би сингуларност могла да значи за нас.

Функционалности слојева референтне архитектуре великих података

Функционалности слојева референтне архитектуре великих података

Прочитајте блог да бисте на најједноставнији начин упознали различите слојеве у архитектури великих података и њихове функционалности.

Еволуција складиштења података – Инфографика

Еволуција складиштења података – Инфографика

Методе складиштења података су се развијале можда од рођења података. Овај блог покрива еволуцију складиштења података на основу инфографике.

6 невероватних предности поседовања паметних кућних уређаја у нашим животима

6 невероватних предности поседовања паметних кућних уређаја у нашим животима

У овом дигиталном свету, паметни кућни уређаји постали су кључни део живота. Ево неколико невероватних предности паметних кућних уређаја о томе како они чине наш живот вредним живљења и једноставнијим.

Ажурирање додатка за мацОС Цаталина 10.15.4 изазива више проблема него што их решава

Ажурирање додатка за мацОС Цаталина 10.15.4 изазива више проблема него што их решава

Недавно је Аппле издао мацОС Цаталина 10.15.4 додатак за исправку проблема, али изгледа да ажурирање изазива више проблема који доводе до квара Мац машина. Прочитајте овај чланак да бисте сазнали више