HADOOP单机版配置

1.需要软件

jdk

hadoop

将jdk和hadoop解压到自己想要存放的路径

这里我解压到/usr/目录下

sudo tar -zxvf java1.8.tar.gz -C /usr/

hadoop同理

然后赋予777权限和使文件所属改为当前用户

sudo chmod -R 777 hadoop/

sudo chown -R chaoba hadoop/

执行完上述操作后，进行环境变量配置

sudo vim ~/.bashrc

export JAVA_HOME=/usr/jdk

export HADOOP_HOME/usr/hadoop

export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

保存后刷新配置文件

sudo source ~/.bashrc

做完上面的操作后。

进入hadoop/etc/hadoop/目录下进行配置文件

需要更改5个文件

vim hadoop-env.sh 更改其中java_home路径为本机java路径

core-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

                <name>fs.defaultFS</name>

                <value>hdfs://localhost:9000</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>file:/home/chaoba/tmp</value>

                <description>Abase for other temporary directories.</description>

        </property>

</configuration>

　　hdfs-site.xml

<configuration>

        <property>

                <name>dfs.replication</name>

                <value>1</value>

        </property>

	<property>

                <name>dfs.namenode.name.dir</name>

                <value>file:/usr/hadoop-2.7.4/tmp/dfs/name</value>

        </property>

	<property>

                <name>dfs.namenode.data.dir</name>

                <value>file:/usr/hadoop-2.7.4/tmp/dfs/data</value>

        </property>

</configuration>

修改mapred-site.xml

说明：在/etc/hadoop的目录下，只有一个mapred-site.xml.template文件，所以必须改名

 mv mapred-site.xml.template mapred-site.xml

在mapred-site.xml文件中

<configuration>

        <property>  //指明mapreduce运行在yarn上

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

</configuration>

修改yarn-site.xml

<configuration>

        <property>

//reduce获取数据的方式

                <name>yarn.nodemanager.aux-services</name>

                <value>mapreduce_shuffle</value>

        </property>

</configuration>

　　配置完成后

配置ssh免密登录:

sudo apt-get install -y openssh-server

cd ~/.ssh/ # 若没有该目录，请先执行一次ssh localhost
ssh-keygen -t rsa # 会有提示，都按回车就可以，如果已经存在，直接进入下一步就可以了
cat ./id_rsa.pub >> ./authorized_keys # 加入授权，把id_rsa.pub 追加到授权的 key 里面去

http://localhost:50070

初始化HDFS系统 bin/hdfs namenode -format

sbin/start-all.sh

# 在hdfs的根目录下建立了一个test目录 bin/hdfs dfs -mkdir /test # 查看HDFS根目录下的目录结构 bin/hdfs dfs -ls /


# 上传 bin/hdfs dfs -put /home/hadoop/haha.txt /test/ # 查看 bin/hdfs dfs -ls /test/
运行wordcount demo

    # 将运行结果保存在/test/out目录下

    bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar wordcount /test/haha.txt /test/out

    # 查看/test/out目录下的文件

    bin/hdfs dfs -ls /test/out

可以得到结果，并保存在part-r-00000中。

    # 查看part-r-00000中的运行结果

    bin/hadoop fs -cat /test/out/part-r-00000

HADOOP单机版配置的更多相关文章

ubuntu下hadoop环境配置
软件环境: 虚拟机:VMware Workstation 10 操作系统:ubuntu-12.04-desktop-amd64 JAVA版本:jdk-7u55-linux-x64 Hadoop版本:h ...
hadoop单机版安装及基本功能演示
本文所使用的Linux发行版本为:CentOS Linux release 7.4.1708 (Core) hadoop单机版安装准备工作创建用户 useradd -m hadoop passwd ...
Ubuntu 12.04搭建hadoop单机版环境
前言: 本文章是转载的,自己又加上了一些自己的笔记整理的详细地址请查看Ubuntu 12.04搭建hadoop单机版环境 Hadoop的三种运行模式独立模式:无需任何守护进程,所有程序都在单个JV ...
CentOS 7 Hadoop安装配置
前言:我使用了两台计算机进行集群的配置,如果是单机的话可能会出现部分问题.首先设置两台计算机的主机名 root 权限打开/etc/host文件再设置hostname,root权限打开/etc/hos ...
hadoop(四):配置参数
hadoop参数配置,主要是配置 core-site.xml,hdfs-site.xml,mapred-site.xml 三个配置文件,core-site.xml是全局配置,hdfs-site.xml ...
hadoop mapred-queue-acls 配置(转)
hadoop作业提交时可以指定相应的队列,例如:-Dmapred.job.queue.name=queue2通过对mapred-queue-acls.xml和mapred-site.xml配置可以对不 ...
hadoop安装配置——伪分布模式
1. 安装这里以安装hadoop-0.20.2为例先安装java,参考这个去着下载hadoop 解压 2. 配置修改环境变量 vim ~/.bashrc export HADOOP_HOME= ...
Hadoop平台配置总结
hadoop的配置,个人感觉是非常容易出问题.一个原因是要配置的地方多,还有个原因就是集群配置要在几台机器上都配置正确,才能保证配置好hadoop,跑起任务. 经过昨晚加今天上午的折腾,总算成功配好了 ...
有关hadoop分布式配置详解
linux配置ssh无密码登录配置ssh无密码登录,先要安装openssh,如下: yum install openssh-clients 准备两台linux服务器或虚拟机,设置两台linux的ho ...

随机推荐

JDK8HashMap的一些思考
JDK8HashMap 文中提及HashMap7的参见博客https://www.cnblogs.com/danzZ/p/14075147.html 红黑树.TreeMap分析详见https://ww ...
Spring Boot 内置定时任务
启用定时任务 @SpringBootApplication @EnableScheduling // 启动类添加 @EnableScheduling 注解 public class ScheduleD ...
再见！【JAVA GUI】
1.GUI概述图形用户界面(Graphical User Interface,简称 GUI,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面. java作为一种面向对象的程序设计语言,它 ...
PyQt（Python+Qt）学习随笔：自定义信号在emit发射信号时报错：AttributeError: object has no attribute
专栏:Python基础教程目录专栏:使用PyQt开发图形界面Python应用专栏:PyQt入门学习老猿Python博文目录如果使用自定义信号,一定要记得信号是类变量,必须在类中定义,不能在实例 ...
RedHat操作指令第4篇
top(查看动态进程运行情况) top 是一个更加有用的命令,可以监视系统中不同的进程所使用的资源.它提供实时的系统状态信息. 显示进程的数据包括 PID.进程属主.优先级.%CPU.%memory等 ...
支持“EFDBContext”上下文的模型已在数据库创建后发生更改。请考虑使用 Code First 迁移更新数据库
在修改数据库表后会出现支持"EFDBContext"上下文的模型已在数据库创建后发生更改.请考虑使用 Code First 迁移更新数据库这个问题解决方法: 在Global.a ...
ES6 代码转成 ES5 代码的实现思路是什么(来自github每日一题)
将代码字符串解析成抽象语法树,即所谓的 AST 对 AST 进行处理,在这个阶段可以对 ES6 代码进行相应转换,即转成 ES5 代码根据处理后的 AST 再生成代码字符串每日一题https:// ...
测试window安装的客户端
1.win10 安装了客户端,测试一下,
【题解】GRE Words(UVA1502)
稍微有点难度--不过没有孔姥爷毒瘤( 题意给定一个单词表,每个单词有权值,取出一部分(不改变顺序)使得这部分的每一个字符串都是后一个的子串,问得到的最大权值. 思路设 f[i] 表示选了第 i 个 ...
题解 CF1426E - Rock, Paper, Scissors
一眼题. 第一问很简单吧,就是每个 $\tt Alice$ 能赢的都尽量让他赢. 第二问很简单吧,就是让 $\tt Alice$ 输的或平局的尽量多,于是跑个网络最大流.$1 - 3$ 的 ...

HADOOP单机版配置

HADOOP单机版配置的更多相关文章

随机推荐

热门专题