kafka集群参数解析server.properties
#server.properties配置文件
broker.id=1
port=9092
host.name=url1
zookeeper.connect=url1:2181,url2:2181,url3:2181
num.network.threads=8 #broker处理消息的最大线程数 一般等于核心数 num.io.threads=8# 同上
socket.send.buffer.bytes=1048576 #socket 发送缓冲区 socket调优参数
socket.receive.buffer.bytes=1048576 #接收缓冲区 socket调优参数
socket.request.max.bytes=104857600 #socket请求最大数值,防止serverOOM
log.dirs=/data/kafka/kafka-logs
num.partitions=8 #默认制定分区 会被命令行参数覆盖
log.retention.check.interval.ms=60000 #文件大小检查周期
log.cleaner.enable=false #是否启用压缩
segment.ms=24*60*60
num.replica.fetchers=4 #leader 进行复制的线程数。 增大这个数值会增加follow的io
default.replication.factor=2 # 创建topic的时候的副本数,可以创建topic时制定参数覆盖
replica.fetch.max.bytes=2048000 # replicas 每次获取数据的最大大小
replica.fetch.wait.max.ms=500 # replicas 同leader之间的通信的最大等待时间,失败了会重试。
replica.high.watermark.checkpoint.interval.ms=5000 #每个replica检查是否将最高水平进行固化的频率
replica.socket.timeout.ms=30000 #follower与leader之间的socket超时时间
replica.socket.receive.buffer.bytes=65536 #leader复制时间的socket缓存大小
replica.lag.time.max.ms=10000 #replicas响应partition leader的最长等待时间,若是超过这个时间,就将replicas列入ISR(in-sync replicas),并认为它是死的,不会再加入管理中
replica.lag.max.messages=4000 #如果follower落后与leader太多,将会认为此follower[或者说partition relicas]已经失效 ##通常,在follower与leader通讯时,因为网络延迟或者链接断开,总会导致replicas中消息同步滞后 ##如果消息之后太多,leader将认为此follower网络延迟较大或者消息吞吐能力有限,将会把此replicas迁移 ##到其他follower中. ##在broker数量较少,或者网络不足的环境中,建议提高此值.
controller.socket.timeout.ms=30000 # partition leader与replicas之间通讯时,socket的超时时间
controller.message.queue.size=10 #partition leader与replicas 数据同步时,消息的队列尺寸
message.max.bytes=2048000 #消息体的最大大小 但是是字节 --------------------
auto.create.topics.enable=true #是否允许自动创建topic,若是false就需要通过命令创建topic
log.index.interval.bytes=4096 #当执行一个fetch操作后,需要一定的空间来扫描最近的offset大小,设置越大,代表扫描速度越快,但是也更好内存,一般情况下不需要搭理这个参数
log.index.size.max.bytes=10485760 #对于segment日志的索引文件大小限制,会被topic创建时的指定参数覆盖
log.retention.hours=24 #数据存储的最大时间超过这个时间会根据log.cleanup.policy设置的策略处理。
log.flush.interval.ms=10000 #仅仅通过interval来控制消息的磁盘写入时机,是不足的.此参数用于控制"fsync"的时间间隔,如果消息量始终没有达到阀值,但是离上一次磁盘同步的时间间隔达到阀值,也将触发. --------
log.flush.interval.messages=20000 #log文件”sync”到磁盘之前累积的消息条数,因为磁盘IO操作是一个慢操作,但又是一个”数据可靠性"的必要手段,所以此参数的设置,需要在"数据可靠性"与"性能"之间做必要的权衡.如果此值过大,将会导致每次"fsync"的时间较长(IO阻塞),如果此值过小,将会导致"fsync"的次数较多,这也意味着整体的client请求有一定的延迟.物理server故障,将会导致没有fsync的消息丢失.
log.flush.scheduler.interval.ms=2000 #检查是否需要固化到硬盘的时间间隔
log.roll.hours=24 #这个参数会在日志segment没有达到log.segment.bytes设置的大小,也会强制新建一个segment会被 topic创建时的指定参数覆盖
log.cleanup.interval.mins=30 #检查处理规则间隔
log.segment.bytes=1073741824 #一个消息长度 超过在创建一个
zookeeper.connection.timeout.ms=6000 #zookeeper连接超时时间
zookeeper.sync.time.ms=2000 #一个zk flower能落后leader多久
fetch.purgatory.purge.interval.requests=1000 ## f防止oom 的参数 用于request 状态转变为complete后从purgatory中移除。
producer.purgatory.purge.interval.requests=1000 ## f防止oom 的参数 用于request 状态转变为complete后从purgatory中移除。
kafka集群参数解析server.properties的更多相关文章
- HyperLedger Fabric基于zookeeper和kafka集群配置解析
简述 在搭建HyperLedger Fabric环境的过程中,我们会用到一个configtx.yaml文件(可参考Hyperledger Fabric 1.0 从零开始(八)--Fabric多节点集群 ...
- 【kafka】安装部署kafka集群(kafka版本:kafka_2.12-2.3.0)
3.2.1 下载kafka并安装kafka_2.12-2.3.0.tgz tar -zxvf kafka_2.12-2.3.0.tgz 3.2.2 配置kafka集群 在config/server.p ...
- zookeeper和Kafka集群安装配置
3个虚拟机,首先关闭防火墙,在进行下面操作 一.java环境 yum list java* yum -y install java-1.8.0-openjdk* 查看Java版本 Java -vers ...
- kafka能做什么?kafka集群配置 (卡夫卡 大数据)
什么是Kafka 官网介绍: 几个概念: 详细介绍 : 操作kafka: kafka集群 消息测试 问题检测 什么是Kafka 官网介绍: ApacheKafka是一个分布式流媒体平台.这到底是什么意 ...
- 分布式消息系统之Kafka集群部署
一.kafka简介 kafka是基于发布/订阅模式的一个分布式消息队列系统,用java语言研发,是ASF旗下的一个开源项目:类似的消息队列服务还有rabbitmq.activemq.zeromq:ka ...
- 大流量大负载的Kafka集群优化实战
前言背景 算法优化改版有大需求要上线,在线特征dump数据逐步放量,最终达到现有Kafka集群5倍的流量,预计峰值达到万兆网卡80%左右(集群有几十个节点,网卡峰值流出流量800MB左右/sec.写入 ...
- 单机简单搭建一个kafka集群(没有进行内核参数和JVM的调优)
1.JDK安装 在我的部署单节点kafka的博客里有相关的方法.(https://www.cnblogs.com/ToBeExpert/p/9789486.html )zookeeper和kafka的 ...
- ELK+Kafka集群日志分析系统
ELK+Kafka集群分析系统部署 因为是自己本地写好的word文档复制进来的.格式有些出入还望体谅.如有错误请回复.谢谢! 一. 系统介绍 2 二. 版本说明 3 三. 服务部署 3 1) JDK部 ...
- Kafka集群的安装和使用
Kafka是一种高吞吐量的分布式发布订阅的消息队列系统,原本开发自LinkedIn,用作LinkedIn的活动流(ActivityStream)和运营数据处理管道(Pipeline)的基础.现在它已被 ...
随机推荐
- Python自动化--语言基础6--模块操作之re、MySQL、Excel
1.Python自有模块正则 import re # re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None print(re.match("aaa ...
- python进阶学习笔记(二)
1.模块和包的概念 python的解决方案是把同名的模块放到不同的包中 1.1,导入模块 要使用一个模块,我们必须首先导入该模块.Python使用import语句导入一个模块.例如,导入系统自带的模块 ...
- Dynamics CRM 2015-Ribbon In Basic Home Tab
前文中有说到关于Form上Ribbon的配置以及控制,而Ribbon Button还可以在其它地方的配置,今天就来说说在Basic Home Tab里面的配置,效果图如下: 具体配置Customiza ...
- WinXP系统下Opencms的安装与配置
1.WinXP系统下安装opencms (1)mysql已安装5.1.40 cmd命令行:mysql -uroot -proot (2)OpenCMS在安装时要求MySQL系统变量“max_al ...
- 在项目中遇到关于 CSS Overflow Hidden在iPhone & Safari不起作用
调试了半天 <!DOCTYPE html> <html> <head> <meta charset="utf-8" /> <m ...
- Yii2框架ACF(AccessControl Filter)的使用
AccessControl其实也就是 yii\filters\AccessControl Filter, 我们下面简写为 ACF 作为描述. ACF,访问控制过滤器,适用于简单的验证,面对的对象便是控 ...
- Mysql基准测试详细解说(根据慕课网:《打造扛得住Mysql数据库架构》视频课程实时笔录)
什么是基准测试 基准测试是一种测量和评估软件性能指标的活动用于建立某个时刻的性能基准,以便当系统发生软硬件变化时重新进行基准测试以及评估变化对性能的影响. 我们可以这样认为:基准测试是针对系统设置的一 ...
- Redis的两种持久化方式-快照持久化和AOF持久化
Redis为了内部数据的安全考虑,会把本身的数据以文件形式保存到硬盘中一份,在服务器重启之后会自动把硬盘的数据恢复到内存(redis)的里边,数据保存到硬盘的过程就称为"持久化"效 ...
- 关于.Net的知识和相关书籍
a. DBCC DROPCLEANBUFFERS 清空缓存信息b. DBCC FREEPROCCACHE 从过程缓存中删除所有元素2. 引用两个和尚打水的故事,说明平时要注重积累,只有量变达到了才会形 ...
- Centos小白命令
centos在登录界面无法输入密码 Centos安装flash插件 Centos挂载windows ntfs分区 Centos搭建Eclipse C/C++环境 windows下的txt文件在cent ...