hadoop记录-hadoop集群日常运维命令

hadoop集群日常运维命令

#1.namenode

hadoop namenode -format #格式化，慎用

su hdfs

hadoop-daemon.sh start namenode

hadoop-daemon.sh stop namenode

#2.journalnode

hadoop-daemon.sh start journalnode

hadoop-daemon.sh stop journalnode

#3.zkfc

hdfs zkfc -formatZK #格式化，慎用

hadoop-daemon.sh start zkfc

hadoop-daemon.sh stop zkfc

#4.datanode

hadoop-daemon.sh start datanode

hadoop-daemon.sh stop datanode

#5.nodemanager

su yarn

yarn-daemon.sh start nodemanager

yarn-daemon.sh stop nodemanager

#6.resourcemanager

yarn-daemon.sh start resourcemanager

yarn-daemon.sh stop resourcemanager

#7.hive

hive --service hiveserver2 #10000

hive --service metastore #9083

#8.zookeeper

bin/zkServer.sh start #2181

bin/zkServer.sh stop

bin/zkServer.sh status

bin/zkCli.sh #连接后台zk服务查看znode,可加-server参数

#HA Federation

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

<name>dfs.nameservices</name>

<value>aaa,bbb</value>

</property>

<!-- aaa -->

<property>

<name>dfs.ha.namenodes.aaa</name>

<value>nn1,nn2</value>

</property>

<property>

<name>dfs.namenode.rpc-address.aaa.nn1</name>

<value>1.1.1.1:8020</value>

</property>

<property>

<name>dfs.namenode.rpc-address.aaa.nn2</name>

<value>1.1.1.2:8020</value>

</property>

<property>

<name>dfs.namenode.http-address.aaa.nn1</name>

<value>1.1.1.1:50070</value>

</property>

<property>

<name>dfs.namenode.http-address.aaa.nn2</name>

<value>1.1.1.2:50070</value>

</property>

<property>

<name>dfs.client.failover.proxy.provider.aaa</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<property>

<name>dfs.namenode.shared.edits.dir.aaa</name>

<value>qjournal://1.1.1.1:8485;1.1.1.2:8485;1.1.1.3:8485/aaa</value>

</property>

<!-- bbb -->

<property>

<name>dfs.ha.namenodes.bbb</name>

<value>nn1,nn2</value>

</property>

<property>

<name>dfs.namenode.rpc-address.bbb.nn1</name>

<value>1.1.1.4:8020</value>

</property>

<property>

<name>dfs.namenode.rpc-address.bbb.nn2</name>

<value>1.1.1.5:8020</value>

</property>

<property>

<name>dfs.namenode.http-address.bbb.nn1</name>

<value>1.1.1.4:50070</value>

</property>

<property>

<name>dfs.namenode.http-address.bbb.nn2</name>

<value>1.1.1.5:50070</value>

</property>

<property>

<name>dfs.namenode.servicerpc-address.bbb.nn1</name>

<value>1.1.1.4:8020</value>

</property>

<property>

<name>dfs.namenode.servicerpc-address.bbb.nn2</name>

<value>1.1.1.5:8020</value>

</property>

<property>

<name>dfs.client.failover.proxy.provider.bbb</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<property>

<name>dfs.namenode.shared.edits.dir.bbb</name>

<value>qjournal://1.1.1.4:8485;1.1.1.5:8485;1.1.1.6:8485/bbb</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:///data/dfs/nn/local</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/data1/dfs/local,/data2/dfs/local</value>

</property>

<property>

<name>dfs.journalnode.edits.dir</name>

<value>/data/dfs/jn</value>

</property>

<property>

<name>dfs.qjournal.start-segment.timeout.ms</name>

<value>60000</value>

</property>

<property>

<name>dfs.qjournal.prepare-recovery.timeout.ms</name>

<value>240000</value>

</property>

<property>

<name>dfs.qjournal.accept-recovery.timeout.ms</name>

<value>240000</value>

</property>

<property>

<name>dfs.qjournal.finalize-segment.timeout.ms</name>

<value>240000</value>

</property>

<property>

<name>dfs.qjournal.select-input-streams.timeout.ms</name>

<value>60000</value>

</property>

<property>

<name>dfs.qjournal.get-journal-state.timeout.ms</name>

<value>240000</value>

</property>

<property>

<name>dfs.qjournal.new-epoch.timeout.ms</name>

<value>240000</value>

</property>

<property>

<name>dfs.qjournal.write-txns.timeout.ms</name>

<value>60000</value>

</property>

<property>

<name>dfs.namenode.acls.enabled</name>

<value>true</value>

<description>Number of replication for each chunk.</description>

</property>

<property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/hdfs/.ssh/id_rsa</value>

</property>

<property>

<name>dfs.ha.automatic-failover.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.permissions.superusergroup</name>

<value>hadoop</value>

</property>

<property>

<name>dfs.datanode.max.transfer.threads</name>

<value>8192</value>

</property>

<property>

<name>dfs.hosts.exclude</name>

<value>/app/hadoop-conf/exclude.list</value>

<description> List of nodes to decommission </description>

</property>

<property>

<name>dfs.datanode.fsdataset.volume.choosing.policy</name>

<value>org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy</value>

</property>

<property>

<name>dfs.datanode.available-space-volume-choosing-policy.balanced-space-threshold</name>

<value>10737418240</value>

</property>

<property>

<name>dfs.datanode.available-space-volume-choosing-policy.balanced-space-preference-fraction</name>

<value>0.75</value>

</property>

<property>

<name>dfs.client.read.shortcircuit.streams.cache.size</name>

<value>1000</value>

</property>

<property>

<name>dfs.client.read.shortcircuit.streams.cache.expiry.ms</name>

<value>10000</value>

</property>

<property>

<name>dfs.client.read.shortcircuit</name>

<value>true</value>

</property>

<property>

<name>dfs.domain.socket.path</name>

<value>/var/run/hadoop-hdfs/dn._PORT</value>

</property>

<property>

<name>dfs.client.read.shortcircuit.skip.checksum</name>

<value>false</value>

</property>

<property>

<name>dfs.block.size</name>

<value>536870912</value>

</property>

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

<property>

<name>dfs.namenode.handler.count</name>

<value>300</value>

</property>

<property>

<name>dfs.datanode.handler.count</name>

<value>40</value>

</property>

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.namenode.datanode.registration.ip-hostname-check</name>

<value>false</value>

</property>

<property>

<name>dfs.datanode.du.reserved</name>

<value>429496729600</value>

</property>

<!--hdfs balancer -policy datanode -threshold 5 -include -f host.txt-->

<!--限制允许Datanode平衡群集的最大并发块移动数,默认为5 -->

<property>

<name>dfs.datanode.balance.max.concurrent.moves</name>

<value>24</value>

</property>

<!--带宽100MB/s,默认为1MB/s-->

<property>

<name>dfs.datanode.balance.bandwidthPerSec</name>

<value>104857600</value>

</property>

<!--mover线程数,默认为1000-->

<property>

<name>dfs.balancer.moverThreads</name>

<value>1024</value>

</property>

<!--datanode传输的最大线程数(如果运行HBase的话建议为16384) -->

<property>

<name>dfs.datanode.max.transfer.threads</name>

<value>4096/value>

</property>

<!--datanode传输的最大线程数(如果运行HBase的话建议为16384) -->

<property>

<name>dfs.datanode.max.transfer.threads</name>

<value>4096/value>

</property>

<!--datanode最大移动数据大小, 默认为10737418240 (=10GB)-->

<property>

<name>dfs.balancer.max-size-to-move</name>

<value>4096/value>

</property>

<!--$ hdfs dfsadmin -setBalancerBandwidth 1073741824

$ nohup hdfs balancer \

-Ddfs.datanode.balance.max.concurrent.moves = 10 \

-Ddfs.balancer.dispatcherThreads = 1024 \

-Ddfs.balance.bandwidthPerSec = 1073741824

-->

</configuration>

hadoop记录-hadoop集群日常运维命令的更多相关文章

Hadoop集群日常运维
(一)备份namenode的元数据 namenode中的元数据非常重要,如丢失或者损坏,则整个系统无法使用.因此应该经常对元数据进行备份,最好是异地备份. 1.将元数据复制到远程站点 (1)以下代码将 ...
Hadoop集群日常运维分类： A1_HADOOP 2015-03-01 21:26 502人阅读评论(0) 收藏
(一)备份namenode的元数据 namenode中的元数据非常重要,如丢失或者损坏,则整个系统无法使用.因此应该经常对元数据进行备份,最好是异地备份. 1.将元数据复制到远程站点 (1)以下代码将 ...
vivo大规模 Kubernetes 集群自动化运维实践
作者:vivo 互联网服务器团队-Zhang Rong 一.背景随着vivo业务迁移到K8s的增长,我们需要将K8s部署到多个数据中心.如何高效.可靠的在数据中心管理多个大规模的K8s集群是我们面临 ...
Docker Swarm 日常运维命令笔记
之前介绍了Docker管理工具-Swarm部署记录,这里简单总结下Docker Swarm的日常维护命令,以作为平时运维笔记. Swarm作为一个管理Docker集群的工具,首先需要将其部署起来,可以 ...
Ceph 存储集群-低级运维
低级集群运维包括启动.停止.重启集群内的某个具体守护进程:更改某守护进程或子系统配置:增加或拆除守护进程.低级运维还经常遇到扩展.缩减 Ceph 集群,以及更换老旧.或损坏的硬件. 一.增加/删除 O ...
Hadoop 启动/停止集群和节点的命令
集群启动/停止Hadoop集群:start-all.sh stop-all.sh 1) 启动NameNode, DataNode 2) 启动JournalNode, JournalNode在hd ...
KingbaseES V8R6集群管理运维案例之---repmgr standby switchover故障
案例说明: 在KingbaseES V8R6集群备库执行"repmgr standby switchover"时,切换失败,并且在执行过程中,伴随着"repmr stan ...
es集群数据库~运维相关
一数据同步方案 1 ES-JDBC 不能实现删除同步操作.MYSQL如果删除,ES不会删除 2 logstash-input-jdbc 能实现insert update,但是仍然不能实现删除 ...
ogg日常运维命令
1.查看历史记录.快捷执行历史中的一条命令 GGSCI (11g) 32> h 23: view param exta24: info all25: lag exta.... GGSCI (11 ...

随机推荐

android使用百度地图最新sdk5.0后后代码混淆时，地图无法显示闪退问题
描述:刚开始遇到这个问题我一步一步去排除,最后发现在初始化地图的时候,代码混淆就有问题了, 问题描述:当跳显示地图的页面APP闪退, 解决对比: 1:对于老版本百度sdk:代码混淆时语句: -libr ...
Git 安装 on centos7
本文演示如何在CentOS7上安装和使用git. 1 准备工作 1.1 浏览器访问安装包下载地址: https://www.kernel.org/pub/software/scm/git/ 找到下载列 ...
sqlserver 2014使用时有Cannot find one or more components
好久没用sqlserver,今天打开却出现了一个错误,Cannot find one or more components,令人头疼.在启动Microsoft SQL Server Managemen ...
Win7环境搭建IIS环境。发布asp.net MVC项目到IIS（第二期）
在IIS环境中给发布项目修改域名,192.168.1.1:8081 ---->> www.preject.com 一.在网站主页中,1找到绑定网站.2编辑. 二.修改网站配置参数. 三. ...
Thermostat：双层存储结构的透明巨页内存管理机制
这是一篇由密歇根大学的Neha Agarwal 和 Thomas F. Wenisch,发表在计算机系统顶会ASLOS的论文,Thermostat: Application-transparent P ...
sql优化个人总结（全）
sql优化总结--博客第一次自己写博客,以后要坚持每掌握一个技能点,就要写一篇博客出来,做一个不满足于一个只会写if...else的程序员. 最近三个月入职了一家新的公司,做的是CRM系统,将公司多 ...
CQOI2019(十二省联考)游记
CQOI2019(十二省联考)游记 Day -? 自从联赛爆炸,\(THUWC\)爆炸,\(WC\)爆炸(就没有不爆炸的)之后我已经无所畏惧... 听说是考\(4.5 h\)吗? Day -1 \(Z ...
No repeats please 全排列
把一个字符串中的字符重新排列生成新的字符串,返回新生成的字符串里没有连续重复字符的字符串个数.连续重复只以单个字符为准例如, aab 应该返回 2 因为它总共有6中排列 (aab, aab, aba ...
JMeter_JDBC 性能测试
用JMeter做JDBC测试配置步骤: 1.测试计划中添加mysql-connector-java-5.1.41-bin.jar 注意: 这里需要注意的是,在不同的环境(Windows或Linux)下 ...
flutter-开发总结
### 上拉加载下拉刷新 ``` import 'dart:async'; import 'package:flutter_easyrefresh/easy_refresh.dart'; import ...

hadoop记录-hadoop集群日常运维命令

hadoop记录-hadoop集群日常运维命令的更多相关文章

随机推荐

热门专题