本文的命令和配置都是基于zookeeper-3.4.6版本。优化很多时候都是基于监控的，所以把这两个内容写在了一起，慢慢消化。

监控

简单地说，监控无非就是获取服务的一些指标，再根据实际业务情况给这些指标设定一个合适的阈值，然后进行告警的一个过程。

如何获取这些指标？

ZooKeeper 提供了四字命令(The Four Letter Words)，用来获取 ZooKeeper 服务的当前状态及相关信息。

有哪些命令可以使用？

ZooKeeper四字命令	功能描述
conf	打印配置
cons	列出所有连接到这台服务器的客户端全部连接/会话详细信息。包括"接受/发送"的包数量、会话id、操作延迟、最后的操作执行等等信息。
crst	重置所有连接的连接和会话统计信息。
dump	列出那些比较重要的会话和临时节点。这个命令只能在leader节点上有用。
envi	打印出服务环境的详细信息。
reqs	列出未经处理的请求
ruok	即"Are you ok"，测试服务是否处于正确状态。如果确实如此，那么服务返回"imok"，否则不做任何相应。
stat	输出关于性能和连接的客户端的列表。
srst	重置服务器的统计。
srvr	列出连接服务器的详细信息
wchs	列出服务器watch的详细信息。
wchc	通过session列出服务器watch的详细信息，它的输出是一个与watch相关的会话的列表。
wchp	通过路径列出服务器watch的详细信息。它输出一个与session相关的路径。
mntr	输出可用于检测集群健康状态的变量列表

如何使用四字命令？

可以在客户端可以通过 telnet 或 nc 向 ZooKeeper 提交相应的命令。举个最常用的栗子：

echo mntr | nc ip 2181

指标名	解释
zk_version	版本
zk_avg_latency	平均响应延迟
zk_max_latency	最大响应延迟
zk_min_latency	最小响应延迟
zk_packets_received	收包数
zk_packets_sent	发包数
zk_num_alive_connections	活跃连接数
zk_outstanding_requests	堆积请求数
zk_server_state	主从状态
zk_znode_count	znode 数
zk_watch_count	watch 数
zk_ephemerals_count	临时节点数
zk_approximate_data_size	近似数据总和大小
zk_open_file_descriptor_count	打开文件描述符数
zk_max_file_descriptor_count	最大文件描述符数
leader才有的指标
zk_followers	Follower 数
zk_synced_followers	已同步的 Follower 数
zk_pending_syncs	阻塞中的 sync 操作

优化方案

1.日志

快照目录 dataDir 和事务日志目录 dataLogDir 分离

写事务日志的目录，需要保证目录空间足够大，并挂载到单独的磁盘上

为了保证数据的一致性，Zookeeper 默认 forceSync 配置为 yes ，

即在返回客户端事务请求响应之前，要将此次请求对应的事务日志刷入到磁盘中，所以事务日志的写入速度，直接决定了 Zookeeper 的吞吐率

Log4j日志优化

调整为 DaliyRollingFileAppender，每天滚动创建新的日志文件

vim $ZOOKEEPER_HOME/conf/log4j.properties

  zookeeper.root.logger=INFO, CONSOLE
  zookeeper.console.threshold=INFO
  zookeeper.log.dir=.
  zookeeper.log.file=zookeeper.log
  zookeeper.log.threshold=DEBUG
  zookeeper.tracelog.dir=.
  zookeeper.tracelog.file=zookeeper_trace.log
  log4j.appender.ROLLINGFILE=org.apache.log4j.RollingFileAppender
  log4j.appender.ROLLINGFILE.Threshold=${zookeeper.log.threshold}
  log4j.appender.ROLLINGFILE.File=${zookeeper.log.dir}/${zookeeper.log.file}
  log4j.appender.ROLLINGFILE.DatePattern='.'yyyy-MM-dd

增加 ZOO_LOG_DIR 配置

vim bin/zkServer.sh


  ZOO_LOG_DIR=$ZOOBINDIR/../log4j

CONSOLE改为ROLLINGFILE

vim bin/zkEnv.sh


  # if [ "x${ZOO_LOG4J_PROP}" = "x" ]
  # then
  #     ZOO_LOG4J_PROP="INFO,CONSOLE"
  # fi
  if [ "x${ZOO_LOG4J_PROP}" = "x" ]
  then
      ZOO_LOG4J_PROP="INFO,ROLLINGFILE"
  fi

2.zoo.cfg配置

globalOutstandingLimit=100000

客户端连接过多，限制客户端请求，避免OOM

preAllocSize=64M 日志文件预分配大小; snapCount=100,000 多少次写事务，生成一个快照如果快照生成频繁可适当调大该参数。

一般zk的应用提倡读大于写，性能较好（10:1），存储元数据用来协调分布式数据最终一致。写过于频繁使用缓存更好

日志文件自动清除

autopurge.snapRetainCount=3 # 要在dataDir中保留的快照数
autopurge.purgeInterval=24 # 设置日志清除时间间隔；设置为“0”以禁用自动清除功能

谨慎修改：

skipACL=yes

忽略ACL验证，可以减少权限验证的相关操作，提升一点性能。

forceSync=no

在不追求强一致性的情况下可以把这个设为no，对写请求的性能提升很有帮助。

forceSync指每次写请求都强制从pagecache固化到磁盘上，才算是写成功返回。

当写请求数量到达一定程度的时候，后续写请求会等待前面写请求的forceSync操作，造成一定延时。

如果追求低延时的写请求，配置forceSync=no，数据写到pagecache后就返回。

但是机器断电的时候，pagecache中的数据有可能丢失。

forceSync=yes；fsync.warningthresholdms=50

若为强一致性场景，可以再设置个fsync.warningthresholdms=50，数据固化到磁盘的操作fsync超过50ms的时候，将会在zookeeper.out中输出一条warn日志（forceSync=yes有效）。

zookeeper-监控与优化-《每日五分钟搞定大数据》的更多相关文章

zookeeper核心-zab协议-《每日五分钟搞定大数据》
上篇文章<paxos与一致性>说到zab是在paxos的基础上做了重要的改造,解决了一系列的问题,这一篇我们就来说下这个zab. zab协议的全称是ZooKeeper Atomic Bro ...
zookeeper-架构设计与角色分工-《每日五分钟搞定大数据》
本篇文章阅读时间5分钟左右点击看<每日五分钟搞定大数据>完整思维导图 zookeeper作为一个分布式协调系统,很多组件都会依赖它,那么此时它的可用性就非常重要了,那么保证可用性的同 ...
HDFS-异常大全-《每日五分钟搞定大数据》
点击看<每日五分钟搞定大数据>完整思维导图以及所有文章目录问题1:Decomminssioning退役datanode(即删除节点) 1.配置exclude: <name>d ...
zookeeper-操作与应用场景-《每日五分钟搞定大数据》
Zookeeper作为一个分布式协调系统提供了一项基本服务:分布式锁服务,分布式锁是分布式协调技术实现的核心内容.像配置管理.任务分发.组服务.分布式消息队列.分布式通知/协调等,这些应用实际上都是基 ...
zookeeper-如何修改源码-《每日五分钟搞定大数据》
本篇文章仅仅是起一个抛砖迎玉的作用,举一个如何修改源码的例子.文章的灵感来自 ZOOKEEPER-2784. 提一个问题先之前的文章讲过zxid的设计,我们先复习下: zxid有64位,分成两部分: ...
zookeeper-分布式锁的代码实现-【每日五分钟搞定大数据】
本文涉及到几个zookeeper简单的知识点,永久节点.有序节点.watch机制.比较基础,熟悉的就别看了跳过这篇吧每个线程在/locks节点下创建一个临时有序节点test_lock_0000000 ...
redis- info调优入门-《每日五分钟搞定大数据》
本文根据redis的info命令查看redis的内存使用情况以及state状态,来观察redis的运行情况以及需要作出的相应优化. info 1.memory used_memory:13409011 ...
五分钟搞定Go.js
五分钟搞定Go.js 1.基于html5~因为Go.js是一个依赖于HTML5特性的JavaScript库,所以需要确保您的页面声明它是一个HTML5文档,当然需要加载库 <!DOCTYPE ...
五分钟搞定 HTTPS 配置，二哥手把手教
01.关于 FreeSSL.cn FreeSSL.cn 是一个免费提供 HTTPS 证书申请.HTTPS 证书管理和 HTTPS 证书到期提醒服务的网站,旨在推进 HTTPS 证书的普及与应用,简化证 ...

随机推荐

<自动化测试方案书>方案书目录排版
自动化测试方案书一.介绍 QQ交流群:585499566 这篇是一个系列,用来给需要做自动化测试方案的人做个参考,文章的内容是我收集网上和自己工作经验所得,希望能够给你们有所帮助背景:因为工作需要 ...
接口的绑定方案和动态SQL
1. 接口绑定方案 MyBatis中, 提供了一套接口绑定方案. 程序员可以提供一个接口, 然后提供对应接口的一个mapper.xml文件. MyBatis会自动将接口和xml文件进行绑定. 实际上就 ...
go 利用orm简单实现接口分布式锁
在开发中有些敏感接口,例如用户余额提现接口,需要考虑在并发情况下接口是否会发生问题.如果用户将自己的多条提现请求同时发送到服务器,代码能否扛得住呢?一旦没做锁,那么就真的会给用户多次提现,给公司带来损 ...
Docker Data Center系列（五）- 使用自定义的TLS安全认证
本系列文章演示如何搭建一个mini的云平台和DevOps实践环境. 基于这套实践环境,可以部署微服务架构的应用栈,演练提升DevOps实践能力. 1 名词说明 CSR: Certificate Sig ...
spark大批量读取Hbase时出现java.lang.OutOfMemoryError: unable to create new native thread
这个问题我去网上搜索了一下,发现了很多的解决方案都是增加的nproc数量,即用户最大线程数的数量,但我修改了并没有解决问题,最终是通过修改hadoop集群的最大线程数解决问题的. 并且网络上的回答多数 ...
SQL Server中通用数据库角色权限处理
SQL Server中通用数据库角色权限处理最近和同事在做数据库权限清理的事情,主要是删除一些账号:取消一些账号的较大的权限等,例如,有一些有db_owner权限,我们取消账号的数据库角色db_ ...
MyBatis笔记----多表关联查询两种方式实现
数据库方式一:XML 按照下面类型建立article表 Article.java package com.ij34.model; public class Article { private int ...
Angular的MVC理解--节自Adam Free的Pro angularv2
1. 定义 Angular的核心是采用MVC模式,即Model-View-Controller,也即MVW,Model-View-Whatever. 如下图所示,借助于ASP.NET的MVC模式来描述 ...
一、Tableau基础
有关函数的官方文档:https://onlinehelp.tableau.com/current/pro/desktop/zh-cn/functions_functions_string.htm 注意 ...
简单易懂的程序语言入门小册子（5）：基于文本替换的解释器，递归，不动点，fix表达式，letrec表达式
这个系列有个显著的特点,那就是标题越来越长.忽然发现今天是读书节,读书节多读书. ==下面是没有意义的一段话============================================== ...

zookeeper-监控与优化-《每日五分钟搞定大数据》

监控