2.7.3版本的hadoop: jar程序所在目录:$HADOOP_HOME/shar/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar 1.本地创建测试文本: mkdir /home/hadoop/data //创建data文件夹 touch testinput.txt //创建测试文本 vim testinput.txt //修改文本 //文本添加一行 this is a test log cat testinput.txt //检查t…
这是搭建hadoop环境后的第一个MapReduce程序: 基于hadoop streaming的python的脚本: 1 map.py文件,把文本的内容划分成单词: #!/usr/bin/pythonimport sys for line in sys.stdin: line = line.strip() words = line.split() for word in words: print('%s\t%s' % (word, 1)) 2 reduce文件,…