HDFS与YARN HA部署配置文件

core-site.xml

<!--Yarn 需要使用 fs.defaultFS 指定NameNode URI -->

<property>

    <name>fs.defaultFS</name>

    <value>hdfs://ruozeclusterg6</value>

</property>

<!--==============================Trash机制======================================= -->

<property>

    <!--多长时间创建CheckPoint NameNode截点上运行的CheckPointer 从Current文件夹创建CheckPoint;默认：0 由fs.trash.interval项指定 ，fs.trash.checkpoint.interval则是指垃圾回收的检查间隔，应该是小于或者等于fs.trash.interval。如果是0，值等同于fs.trash.interval。每次检查器运行，会创建新的检查点。-->

    <name>fs.trash.checkpoint.interval</name>

    <value>0</value>

</property>

<!--指定hadoop临时目录, hadoop.tmp.dir 是hadoop文件系统依赖的基础配置，很多路径都依赖它。如果hdfs-site.xml中不配 置namenode和datanode的存放位置，默认就放在这>个路径中 -->

<property>

    <name>hadoop.tmp.dir</name>

    <value>/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/tmp</value>

</property>

#hadoop.tmp.dir需要自己创建

[hadoop@hadoop001 hadoop]$ mkdir -p /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/tmp

<!-- 指定zookeeper地址 -->

<property>

    <name>ha.zookeeper.quorum</name>

    <value>hadoop001:2181,hadoop002:2181,hadoop003:2181</value>

</property>

<!--hadoop代理user的host,hadoop进程允许访问的用户机器host或者用户组，proxyuser后面指定的hadoop进程运行的用户，如果改成别的用户，则必须以该用户启动hadoop进程-->

<property>

    <name>hadoop.proxyuser.hadoop.hosts</name>

    <value>*</value>

</property> 

<property>

    <name>hadoop.proxyuser.hadoop.groups</name>

    <value>*</value>

</property>

hdfs-site.xml

<!--dfs的namenode节点的name.dir目录需要自己创建-->

<property>

    <name>dfs.namenode.name.dir</name>

    <value>/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/data/dfs/name</value>

    <description> namenode 存放name table(fsimage)本地目录（需要修改）</description>

</property>

[hadoop@hadoop001 hadoop]$ mkdir -p /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/data/dfs/name

<!--dfs的datanode的data。dir目录，同样需要自己创建-->

<property>

    <name>dfs.datanode.data.dir</name>

    <value>/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/data/dfs/data</value>

    <description>datanode存放block本地目录（需要修改）</description>

</property>

<!--HDFS高可用配置 -->

<!--指定hdfs的nameservice为clustername,需要和core-site.xml中的保持一致 -->

<property>

    <name>dfs.nameservices</name>

    <value>ruozeclusterg6</value>

</property>

<property>

    <!--设置NameNode IDs 此版本最大只支持两个NameNode,nn1,nn2表示的是下面的hadoop001跟hadoop002的映射-->

    <name>dfs.ha.namenodes.ruozeclusterg6</name>

    <value>nn1,nn2</value>

</property>

<!-- Hdfs HA: dfs.namenode.rpc-address.[nameservice ID] rpc 通信地址 -->

<property>

    <name>dfs.namenode.rpc-address.ruozeclusterg6.nn1</name>

    <value>hadoop001:8020</value>

</property>

<property>

    <name>dfs.namenode.rpc-address.ruozeclusterg6.nn2</name>

    <value>hadoop002:8020</value>

</property>

<property>

    <!--JournalNode存放数据地址，同样需要自己创建 -->

    <name>dfs.journalnode.edits.dir</name>

    <value>/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/data/dfs/jn</value>

</property>

[hadoop@hadoop001 hadoop]$ mkdir -p /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/data/dfs/jn

<!--这边配置的是SSH信任关系私钥的配置，前面配置了hadoop的信任关系，这边也配置成hadoop-->

<property>

    <name>dfs.ha.fencing.ssh.private-key-files</name>

    <value>/home/hadoop/.ssh/id_rsa</value>

</property>

<!--动态许可datanode连接namenode列表 -->

<property>

    <name>dfs.hosts</name>

    <value>/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop/slaves</value>

</property>

mapred-site.xml

<!-- 配置 MapReduce Applications -->

<property>

    <name>mapreduce.framework.name</name>

    <value>yarn</value>

</property>

<!-- JobHistory Server ============================================================== -->

<!-- 配置 MapReduce JobHistory Server 地址 ，默认端口10020 -->

<property>

    <name>mapreduce.jobhistory.address</name>

    <value>hadoop001:10020</value>

</property>

<!-- 配置 MapReduce JobHistory Server web ui 地址， 默认端口19888 -->

<property>

    <name>mapreduce.jobhistory.webapp.address</name>

    <value>hadoop001:19888</value>

</property>

<!-- 配置 Map段输出的压缩,snappy-->

<property>

    <name>mapreduce.map.output.compress</name>

    <value>true</value>

</property>

<property>

    <name>mapreduce.map.output.compress.codec</name>

    <value>org.apache.hadoop.io.compress.SnappyCodec</value>

</property>

yarn-site.xml

<!-- 集群名称，确保HA选举时对应的集群,rm1,rm2代表了hadoop001跟hadoop002的映射 -->

<property>

    <name>yarn.resourcemanager.cluster-id</name>

    <value>yarn-cluster</value>

</property>

<property>

    <name>yarn.resourcemanager.ha.rm-ids</name>

    <value>rm1,rm2</value>

</property>

<!-- Client访问RM的RPC地址 (applications manager interface) -->

<property>

    <name>yarn.resourcemanager.address.rm1</name>

    <value>hadoop001:23140</value>

</property>

<property>

    <name>yarn.resourcemanager.address.rm2</name>

    <value>hadoop002:23140</value>

</property>

<!--yarn的资源配置-->

<property>

    <name>yarn.nodemanager.resource.memory-mb</name>

    <value>2048</value>

</property>

<property>

    <name>yarn.scheduler.minimum-allocation-mb</name>

    <value>1024</value>

    <discription>单个任务可申请最少内存，默认1024MB</discription>

</property>

<property>

    <name>yarn.scheduler.maximum-allocation-mb</name>

    <value>2048</value>

    <discription>单个任务可申请最大内存，默认8192MB</discription>

</property>

<property>

    <name>yarn.nodemanager.resource.cpu-vcores</name>

    <value>2</value>

</property>

启动流程:

1.启动journalnode：hadoop-daemon.sh start journalnode

2.格式化hadoop namenode，同时将namenode1的data文件copy到namenode2，保证一致：

hadoop namenode -format

3.zkfc格式化：hdfs zkfc -formatZK

4.启动集群：start-dfs.sh

5.启动yarn：start-yarn.sh ，手动启动第二台机器的resourcemanager：yarn-daemon.sh start resourcemanager

6.正常启动集群之后，可以通过web页面，访问hdfs端口50070以及yarn端口8088

HDFS与YARN HA部署配置文件的更多相关文章

HDFS 和YARN HA 简介
HDFS: 基础架构 1.NameNode(Master) 1)命名空间管理:命名空间支持对HDFS中的目录.文件和块做类似文件系统的创建.修改.删除.列表文件和目录等基本操作. 2)块存储管理. 使 ...
YARN HA部署架构
hadoop001: zk rm(zkfc线程) nm hadoop002: zk rm(zkfc线程) nm hadoop003: zk nm RMStateStore: 存储在ZK的/rmstor ...
Hadoop 学习笔记（九） hadoop2.2.0 生产环境部署 HDFS HA部署方法
step1:将安装包hadoop-2.2.0.tar.gz存放到某一个目录下,并解压 step2:修改解压后的目录中的文件夹/etc/hadoop下的xml配置文件(如果文件不存在,则自己创建) 包括 ...
HDFS NameNode HA 部署文档
简介: HDFS High Availability Using the Quorum Journal Manager Hadoop 2.x 中,HDFS 组件有三个角色:NameNode.DataN ...
【Hadoop】Hadoop HA 部署详细过程（架构、机器规划、配置文件、部署步骤）
1.概念.架构 2.配置文件示例.部署步骤 hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA.YARN等.最新的hadoop-2.4.1又增加了YARN HA 注意:apac ...
[转]HDFS HA 部署安装
1. HDFS 2.0 基本概念相比于 Hadoop 1.0,Hadoop 2.0 中的 HDFS 增加了两个重大特性,HA 和 Federaion.HA 即为 High Availability, ...
Hadoop 2.7.4 HDFS+YRAN HA部署
实验环境主机名称 IP地址角色统一安装目录统一安装用户 sht-sgmhadoopnn-01 172.16.101.55 namenode,resourcemanager /usr/local ...
HDFS 和 YARN 的 HA 故障切换【转】
来源:https://blog.csdn.net/u011414200/article/details/50336735 一非 HDFS HA 集群转换成 HA 集群二 HDFS 的 HA 自动切换 ...
Apache hadoop namenode ha和yarn ha ---HDFS高可用性
HDFS高可用性Hadoop HDFS 的两大问题:NameNode单点:虽然有StandbyNameNode,但是冷备方案,达不到高可用--阶段性的合并edits和fsimage,以缩短集群启动的时 ...

随机推荐

林克的小本本之——HCL网络知识随笔
单臂路由单臂路由是一种通过在路由器的一个接口上配置逻辑接口,来实现不同Vlan之间互通的方法. 实例: #配置SW1的VLAN [SW1]vlan 2 #配置端口vlan略 [SW1]int g1/ ...
num2str(A, format)
str = num2str(A, format)A: 数值类型的数组或者是单个的数值format:指定数字转换为字符串的格式,通常’%11.4g’是默认的.也可以指定转换为几位的字符串,不足用0填充, ...
GCC编译警告选项总结
一前言 GCC有很多的编译选项,警告选项:指定头文件.库路径:优化选项.本文针整理一下GCC的警告选项,主要依据http://gcc.gnu.org/onlinedocs/gcc/Warning-O ...
weui实现滚动加载的效果
weui是微信公司提供的一个UI框架,在H5开发中一些组件可以直接使用.weui文档地址:http://www.jqweui.cn/components 使用weui,需要引入weui.css和jqu ...
Java安装JDK
因为Java程序必须运行在JVM之上,所以,我们第一件事情就是安装JDK. 搜索JDK 13,确保从Oracle的官网下载最新的稳定版JDK: 1.选择JDK版本 2.同意协议,点击合适系统平台下载 ...
default(T);
在泛型类型中,由于泛型类型即可以是引用类型也可以是值类型,所以不能用null来表示默认值.这里通过default来进行.引用类型的default将泛型类型初始化null,值类型的default将泛型类 ...
Django 执行 makemigrations 显示 No changes detected in app
在Django项目配置一下多数据库,但是运行 makemigrations 执行不正常 $ python manage.py makemigrations polls No changes detec ...
运维工程师必会工具(Nmap和TCPdump)
1.NMap工具主要功能:探测主机是否在线.扫描主机开放端口和嗅探网络服务,用于网络探测和安全扫描. NMap支持很多扫描技术,例如:UDP.TCPconnect().TCPSYN(半开扫描).ft ...
Node接口实现HTTPS版的
最近由于自己要做一个微信小程序,接口地址只能是https的,这就很难受了于是乎,我租了个服务器,搞了个免费的ssl认证可是呢,我不会搞https接口怎样实现今天特意花了一天时间来学,来学习 &q ...
vue_04day 路由初始
目录 vue_04 项目初始: vue 文件构造: vue项目目录结构: 项目入口(main.js): vue项目启动生命周期: 根组件(vue.js): router.js: 创建的页面: 全局样式 ...

HDFS与YARN HA部署配置文件

HDFS与YARN HA部署配置文件的更多相关文章

随机推荐

热门专题