hadoop 伪分布模式环境搭建
一 安装JDK
下载JDK jdk-8u112-linux-i586.tar.gz
解压JDK hadoop@ubuntu:/soft$ tar -zxvf jdk-8u112-linux-i586.tar.gz
使配置生效 hadoop@ubuntu:/soft/jdk1.8.0_112$ source /etc/profile
检验配置:hadoop@ubuntu:/soft/jdk1.8.0_112$ java
检验配置:hadoop@ubuntu:/soft/jdk1.8.0_112$ javac
二 安装SSH
下载安装: hadoop@ubuntu:/soft/jdk1.8.0_112$ sudo apt-get install ssh
生成KEY hadoop@ubuntu:/soft/jdk1.8.0_112$ ssh-keygen -t rsa -P "" 回车
追加公钥到授权KEY里 hadoop@ubuntu:/soft/jdk1.8.0_112$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
ssh localhost 如果不用输入密码即安装成功
三 安装hadoop及配置
1 下载 hadoop http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz
2 解压hadoop hadoop@ubuntu:/soft/hadoop$ tar -zxvf hadoop-2.7.3.tar.gz
3 修改Hadoop-env.sh,添加JAVA_HOME路径
hadoop@ubuntu:/soft/hadoop/hadoop-2.7.3/etc/hadoop$ vim hadoop-env.sh
添加:export JAVA_HOME=/soft/jdk1.8.0_112
4 修改core-site.xml
6 新建mapred-site.xml
7 配置yarn-site.xml
8 格式化HDFS文件系统
hadoop@ubuntu:/soft/hadoop/hadoop-2.7.3$ bin/hadoop namenode -format
9 启动相关进程
hadoop@ubuntu:/soft/hadoop/hadoop-2.7.3$ sbin/start-all.sh
10 查看进程是否启动成功
hadoop@ubuntu:/soft/hadoop/hadoop-2.7.3$ jps
6373 SecondaryNameNode
6859 Jps
6523 ResourceManager
6766 NodeManager
6206 DataNode
四 验证安装是否成功
- 输入:
进入ResourceManager管理页面 - 输入:
五 测试验证
$ bin/hadoop dfs -mkdir /user
$ bin/hadoop dfs -mkdir /user/hadoop
$ bin/hadoop dfs -mkdir /user/hadoop/input
2 将数据导入HDFS 的input文件夹
$ bin/hadoop dfs -put /etc/protocols /user/hadoop/input
3 执行Hadoop WordCount应用(词频统计)
# 如果存在上一次测试生成的output,由于hadoop的安全机制,直接运行可能会报错,所以请手动删除上一次生成的output文件夹
$ bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.3-sources.jar org.apache.hadoop.examples.WordCount input output
hadoop@ubuntu:/soft/hadoop/hadoop-2.7.3$ bin/hadoop dfs -cat output/part-r-00000
