文章插圖

文章插圖
【配置hadoop環境配置文件 Hadoop環境配置】單節點集群模式(a Single Node Cluster)又稱偽分布模式,只需一個節點即可運行 。這種模式一般只是用來學習或者開發、測試使用 。實際使用中還是使用多節點的分布式 。
1、環境變量配置
為了方便的執行Hadoop程序,需要配置很多系統環境變量 。主要有以下幾個變量
設置HADOOP_HOME為Hadoop的安裝路徑
export HADOOP_HOME=/home/hduser/hadoop
設置將hadoop添加到PATH,上文中已經介紹過hadoop的運行文件在bin和sbin目錄下,通過設置PATH后,我們可以在任何位置執行hadoop命令 。
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin
設置hadoop其他環境變量
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
鏈接庫的相關設置
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME
export HADOOP_OPTS=”-Djava.library.path=$HADOOP_HOME/lib”
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH
與配置Jdk的系統環境變量方法一致,我們只需將需要配置的系統變量添加到用戶主目錄下的.bashrc文件中即可 。打開Ubuntu虛擬機,然后打開Xshell連接登陸到虛擬機,在用戶主目錄下執行命令 vim .bashrc
cd hadoop/ #進入Hadoop安裝文件目錄
mkdir ./input #在hadoop文件夾下創建輸入文件
cp ./etc/hadoop/*.xml ./input #將配置文件作為輸入文件
./bin/hadoop jar./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output ‘dfs[a-z.]+’ #運行MapReduce中grep例子,篩選符合正則表達式dfs[a-z]+的單詞并統計其出現的次數,并將結果放入output文件夾中,關于正則表達式更多內容,參見附錄三:正則表達式速查表格
cat ./output/* #查看運行結果
刪除創建的文件使用以下命令
rm -r ./output
rm -r ./input
Hadoop 還可以在單節點上以偽分布式的方式運行,此時Hadoop 進程以分離的 Java 進程來運行,節點既作為NameNode 也作為 DataNode,同時讀取的是 HDFS 中的文件 。這種模式需要修改相應的配置文件,我們將會在下文中進行詳細講解 。
- jdk配置失敗的原因 jdk環境變量總是配置不成功
- 華三交換機配置大全 華三交換機基本命令
- sql數據庫配置文件在哪里 oracle數據庫連接配置文件在哪里
- 聯想sr850配置raid步驟 聯想sr850管理口地址
- 聯想旭日410a筆記本配置 聯想旭日410l配置
- 臺式機參數怎么看 臺式電腦怎樣看配置參數
- 怪物獵人配置要求高嗎 怪物獵人配置要求i5能玩嗎
- java怎樣配置環境變量 Java如何配置環境變量
- 聯想V110配置參數 聯想 V110
- 聯想揚天v110-14配置 聯想揚天v110-15配置
