[hadoop] 集群启动和内存调优

1、启动Hadoop集群

#首先查看下zoo.cfg里面配置的server.id和集群主机的id是否一致

#如果不一致会造成yarn控制不了从节点的启动

cat /home/hadoop/zookeeper/conf/zoo.cfg

cat /home/hadoop/zookeeper/data/myid

#分别停止和启动各节点的zookeeper

#保证每台节点的状态为follow或者leader

/home/hadoop/zookeeper/bin/zkServer.sh stop

/home/hadoop/zookeeper/bin/zkServer.sh start

/home/hadoop/zookeeper/bin/zkServer.sh status

#启动hadoop

#成功启动后可访问

#http://master:50070/dfshealth.html#tab-overview

#http://master:8088/cluster/nodes

/home/hadoop/hadoop/sbin/start-all.sh

/home/hadoop/hadoop/sbin/stop-all.sh 

#启动hbase

#成功启动后可访问

#http://master:60010/master-status?filter=all#baseStats

#Region Servers 会列出hbase的节点列表

/home/hadoop/hbase/bin/start-hbase.sh

/home/hadoop/hbase/bin/stop-hbase.sh

2、提示信息

#hadoop

[hadoop@master sbin]$ ./start-all.sh

This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh

Starting namenodes on [master]

master: starting namenode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-namenode-master.out

localhost: starting datanode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-datanode-master.out

node1: starting datanode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-datanode-node1.out

node2: starting datanode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-datanode-node2.out

Starting secondary namenodes [master]

master: starting secondarynamenode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-secondarynamenode-master.out

starting yarn daemons

starting resourcemanager, logging to /home/hadoop/hadoop/logs/yarn-hadoop-resourcemanager-master.out

localhost: starting nodemanager, logging to /home/hadoop/hadoop/logs/yarn-hadoop-nodemanager-master.out

node1: starting nodemanager, logging to /home/hadoop/hadoop/logs/yarn-hadoop-nodemanager-node1.out

node2: starting nodemanager, logging to /home/hadoop/hadoop/logs/yarn-hadoop-nodemanager-node2.out

#hbase

[hadoop@master sbin]$ start-hbase.sh

master: starting zookeeper, logging to /home/hadoop/hbase/bin/../logs/hbase-hadoop-zookeeper-master.out

node1: starting zookeeper, logging to /home/hadoop/hbase/bin/../logs/hbase-hadoop-zookeeper-node1.out

node2: starting zookeeper, logging to /home/hadoop/hbase/bin/../logs/hbase-hadoop-zookeeper-node2.out

starting master, logging to /home/hadoop/hbase/logs/hbase-hadoop-master-master.out

node2: starting regionserver, logging to /home/hadoop/hbase/bin/../logs/hbase-hadoop-regionserver-node2.out

node1: starting regionserver, logging to /home/hadoop/hbase/bin/../logs/hbase-hadoop-regionserver-node1.out

3、守护进程

#主节点

[hadoop@master sbin]$ jps

 Jps

 ResourceManager（资源管理者）

 NameNode（主节点）

 SecondaryNameNode（备用主节点）

 HMaster（Hbase管理者）

 NodeManager（节点管理者）

 QuorumPeerMain（zookeeper守护进程）

 DataNode（主节点也作为数据节点）

#从节点

[hadoop@node2 conf]$ jps

 Jps

 HRegionServer（Hbase从节点）

 NodeManager（节点管理）

 HQuorumPeer（zookeeper守护进程）

 DataNode（数据节点）

4、心得总结

#启动顺序

()先用jps查看是否还有没有停止的hadoop服务，有就先全部停止

()先启动 zookeeper：~/zookeeper/bin/zkServer.sh start

不管主从每一个节点的zk都要单独启动 启动后

用jps查看 有没有 QuorumPeerMain 进程

或者用 ~/zookeeper/bin/zkServer.sh status 查看角色

从属：follower

主：leader

()再启动hadoop：~/hadoop/sbin/start-all.sh

主节点 jps查看是否有Namenode等进程

从节点 jps查看是否有Datanode等进程

()最后启动hbase：~/hbase/bin/start-hbase.sh

主节点 jps查看是否有HMaster等进程

从节点 jps查看是否有HRegionserver等进程

#其他

　　(1)如果从节点HBASE启动失败
　　1、检查zookeeper/data下myid是否正确
　　2、实在不行单独启动从节点
　　hbase-daemon.sh start regionserver

　　(2)namenode没启动成功先检查是不是端口被占用
　　netstat -atunp | grep 9000
　　ps -aux | grep hadoop

　　(3)如果zk的端口被绑定占用
　　ps -aux | grep zookeeper
　　看看是否有其他的用户比如【root】启动过zk

5、内存调优

【hadoop】512 - 4096

/home/hadoop/hadoop/etc/hadoop/hadoop-env.sh

export HADOOP_PORTMAP_OPTS="-Xmx4096m $HADOOP_PORTMAP_OPTS"

export HADOOP_CLIENT_OPTS="-Xmx4096m $HADOOP_CLIENT_OPTS"

【yarn】2048 - 4096

/home/hadoop/hadoop/etc/hadoop/yarn-env.sh

JAVA_HEAP_MAX=-Xmx4096m

【hbase】

#以前的

export HBASE_MASTER_OPTS="$HBASE_MASTER_OPTS $HBASE_JMX_BASE -Xmx1000m -Xms1000m -Xmn750m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70"

export HBASE_REGIONSERVER_OPTS="$HBASE_REGIONSERVER_OPTS $HBASE_JMX_BASE -Xmx3096m -Xms3096m -Xmn1220m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70"

export HBASE_THRIFT_OPTS="$HBASE_THRIFT_OPTS $HBASE_JMX_BASE -Xms100m -Xmx1024m"

export HBASE_ZOOKEEPER_OPTS="$HBASE_ZOOKEEPER_OPTS $HBASE_JMX_BASE -Xms100m -Xmx1024m"

#现在修改为

export HBASE_MASTER_OPTS="$HBASE_MASTER_OPTS $HBASE_JMX_BASE -Xmx8192m -Xms8192m -Xmn6144m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70"

export HBASE_REGIONSERVER_OPTS="$HBASE_REGIONSERVER_OPTS $HBASE_JMX_BASE -Xmx10240m -Xms10240m -Xmn5120m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70"

export HBASE_THRIFT_OPTS="$HBASE_THRIFT_OPTS $HBASE_JMX_BASE -Xms1024m -Xmx4096m"

export HBASE_ZOOKEEPER_OPTS="$HBASE_ZOOKEEPER_OPTS $HBASE_JMX_BASE -Xms2048m -Xmx4096m"

[hadoop] 集群启动和内存调优的更多相关文章

PB 级大规模 Elasticsearch 集群运维与调优实践
PB 级大规模 Elasticsearch 集群运维与调优实践 https://mp.weixin.qq.com/s/PDyHT9IuRij20JBgbPTjFA | 导语腾讯云 Elasticse ...
Hadoop集群启动之后,datanode节点未正常启动的问题
Hadoop集群启动之后,用JPS命令查看进程发现datanode节点上,只有TaskTracker进程.如下图所示 master的进程: 两个slave的节点进程发现salve节点上竟然没有dat ...
一次hadoop集群机器加内存的运维过程
由于前期的集群规划问题,导致当前Hadoop集群中的硬件并没有完全利用起来.当前机器的内存CPU比例为2G:1core,但一般的MapReduce任务(数据量处理比较大,逻辑较复杂)的MR两端都需要将 ...
解决hadoop 集群启动常见错误办法
hadoop 集群常见错误解决办法 hadoop 集群常见错误解决办法: (一)启动Hadoop集群时易出现的错误: 1. 错误现象:Java.NET.NoRouteToHostException ...
Hadoop集群启动
1.初始化集群要启动Hadoop集群,需要启动HDFS和YARN两个集群注意:首次启动HDFS时,必须对其进行格式化操作.本质上是一些清理和准备工作, 因为此时的HDFS在物理上还是不存在的命令 ...
PB级大规模Elasticsearch集群运维与调优实践
导语 | 腾讯云Elasticsearch 被广泛应用于日志实时分析.结构化数据分析.全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与 ...
PB级大规模Elasticsearch集群运维与调优实践【＞＞戳文章免费体验Elasticsearch服务30天】
[活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...
每秒处理3百万请求的Web集群搭建-为最佳性能调优 Nginx
这篇文章是<打造3百万次请求/秒的高性能服务器集群>系列的第2部分,在这个部分中你可以使用任何一种 WEB 服务器,不过我决定使用 Nginx,因其轻量级.高可靠及高性能的优点. 通常来说 ...
Kafka_2.12-2.5.1集群搭建与参数调优
Kafka是目前业界使用最广泛的消息队列.数据流转常见这样的业务场景,客户端把采集到的日志推送给Kafka,业务方可以消费Kafka的数据落地HDFS,用于离线分析,也可以使用Spark或Flink消 ...

随机推荐

oracle数据库中提供的5种约束
约束作用:用来保持数据的完整性,防止无效数据进入到数据库中.oracle数据库中提供的5种约束,都是限定某个列或者列的组合的.1.主键约束(PRIMARY KEY):在一个表中能唯一的标识一行.主键可 ...
Socket通信常用方法
使用tcp协议,链接服务器的方法 /// <summary> /// 连接使用tcp协议的服务端 /// </summary> /// <param name=" ...
CUBRID学习笔记 25 数据类型2
---恢复内容开始--- 6枚举类型语法 <enum_type> : ENUM '(' <char_string_literal_list> ')' <char_str ...
SQL：with ties
摘自: http://www.cnblogs.com/huanghai223/archive/2010/10/26/1861961.html “从100万条记录中的得到成绩最高的记录”.看到这个题目, ...
HDU 5422 Rikka with Graph
Rikka with Graph Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others) ...
git学习笔记05-从远程库克隆
现在,假设我们从零开发,那么最好的方式是先创建远程库,然后,从远程库克隆. 首先,登陆GitHub,创建一个新的仓库,名字叫gitskills: 我们勾选Initialize this reposit ...
Java多线程同步问题的探究
一.线程的先来后到——问题的提出:为什么要有多线程同步?Java多线程同步的机制是什么? http://www.blogjava.net/zhangwei217245/archive/2010/03/ ...
SAP供应商和客户的创建
进来遇到一个创建供应商的需求,由于在系统中关于供应商和客户的创建比较特殊,且没有相关函数进行创建, 找到一个类和方法来创建,类名:VMD_EI_API 方法名:MAINTAIN_DIRECT_INP ...
mysql 理解 int(11)
1.这里的int(11) 与int的大小和存储字节,没有一毛钱关系,int的存储字节是4个字节,最大值为 65536*65536 = 40多亿,对于有符号的int,是20多亿.2.那么这里的(11) ...
mysql 选择性高
选择性高是指能够过滤掉更多不需要的记录.举例来说,在一个公司里,使用性别只能过滤掉一半的人,而使用姓名一般可以过滤掉99%以上的人,因为会有重名情况,而使用员工号,选出一个,其他的全部过滤掉.也就是说 ...

[hadoop] 集群启动和内存调优

[hadoop] 集群启动和内存调优的更多相关文章

随机推荐

热门专题