kafka 高可靠

1.集群高可靠

①搭建kafka集群（略）

②重点配置项（每个broker配置相同，只有broker.id不一样）

broker.id=1 当前机器在集群中的唯一标识，和zookeeper的myid性质一样

listeners=PLAINTEXT://10.22.0.13:9092 最好用真实的IP

advertised.listeners=PLAINTEXT://10.22.0.13:9092 最好用真实的IP hostname,port配置过时

num.partitions=3 新建topic 默认分区数

default.replication.factor=3 新建topic 默认副本集数

offsets.topic.replication.factor=3 副本集因子（必须配置为大于1，小于或者等于broker数，不然当消费者的协同节点broker宕机了，不会重新选举，导致消费者dead，达不到集群高可靠目的）

zookeeper.connect=10.22.0.13:2182,10.22.0.14:2182,10.22.0.15:2182 zookeeper地址

log.dirs=/home/txc/kafka1/kafkalogs kafka数据日志保存路径

2.消息至少消费一次

消费者默认情况下，enable.auto.commit=true 消费者的offset消费者的offset将在后台周期性的提交,当消息处理失败时，偏移量offset已经提交了，导致消息丢失

要保证消费至少消费一次，首先enable.auto.commit=false，然后每次消息处理成功后，手动提交偏移量offset， consumer.commitAsync();

3.自定义分区(尽可能让数据在分区中均匀分布)

Kafka中，topic是逻辑上的概念，而partition是物理上的概念。不用担心，这些对用户来说是透明的。生产者（producer）只关心自己将消息发布到哪个topic，而消费者（consumer）只关心自己订阅了哪个topic上的消息，至少topic上的消息分布在哪些partition节点上，它本身并不关心。

如果没有分区的概念，那么topic的消息集合将集中于某一台服务器上，单节点的存储性能马上将成为瓶颈，当访问该topic存取数据时，吞吐也将成为瓶颈。 
介于此，kafka的设计方案是，生产者在生产数据的时候，可以为每条消息人为的指定key，这样消息被发送到broker时，会根据分区规则，选择消息将被存储到哪一个分区中。
如果分区规则设置合理，那么所有的消息将会被均匀/线性的分布到不同的分区中，这样就实现了负载均衡和水平扩展。另外，在消费者端，同一个消费组可以多线程并发的从多个分区中 同时消费数据。
上述分区规则，实际上是实现了kafka.producer.Partitioner接口的一个类，这个实现类可以根据自己的业务规则进行自定义制定，如根据hash算法指定分区的分布规则。 如以下这个类，我们先获取
key的hashcode值，再跟分区数量（配置文件中为numPartitions）做模运算，结果值作为分区存储位置，这样可以实现数据均匀线性的分布。

①自定义TxcPartitioner类

public class TxcPartitioner implements Partitioner{

    @Override

    public void configure(Map<String, ?> arg0) {

    }

    @Override

    public void close() {

    }

    @Override

    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {

        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);

        int size = partitions.size();

　　　　//如果消息的 key 为 null,默认分配到指定分区

        if(keyBytes == null) {

            return 0;

        }

　　　　 //如果 key 不为 null，并且使用了默认的分区器，kafka 会使用自己的 hash 算法对 key 取 hash 值，

       //使用 hash 值与 partition 数量取模，从而确定发送到哪个分区。

       //注意：此时 key 相同的消息会发送到相同的分区(只要 partition 的数量不变化)

　　　　return Utils.toPositive(Utils.murmur2(keyBytes)) % size;

}

②发送消息的方法如下

public void send(String topic,String key,RequestMessage message){

        try {

            if(kafkaProducer != null) {

                ProducerRecord<String, String> record = new ProducerRecord<String, String>(topic,key,JSONObject.toJSONString(message));

                Future<RecordMetadata> future = kafkaProducer.send(record);

                RecordMetadata metadata = future.get();

                if(metadata != null) {

                    sysLog.debug("【Kafka message send success,topic = {}, partition is {} 】 " , metadata.topic(),metadata.partition());

                }else {

                    sysLog.error("【Kafka message send fail 】");

                    throw new KafkaSendException("Kafka message send fail");

                }

            }else {

                sysLog.error("【TxcProducer is not init】");

                throw new KafkaInitException("TxcProducer is not init");

            }

        }catch(Exception e){

            sysLog.error("【Kafka message send fail , exception = {}】 ",ExceptionUtil.collectExceptionStackMsg(e));

            throw new KafkaSendException("Kafka message send fail");

        }

    }

③生产者配置中添加配置

//设置自定义分区

properties.put(TxcParameType.partitioner_class.getName(), TxcPartitioner.class.getName());

注意：之所以需要自定义分区，是因为同一个分区的消息可以保证严格的顺序性，通过自定义分区设置的key值（比如交易流水号）可以让同一笔交易的消息严格按照顺序发送接收

4.消息到达可靠

保证消息到达可靠，生产者的配置项acks=all;

生产者需要leader确认请求完成之前接收的应答数。此配置控制了发送消息的耐用性，支持以下配置：

acks=0 如果设置为0，那么生产者将不等待任何消息确认。消息将立刻天际到socket缓冲区并考虑发送。在这种情况下不能保障消息被服务器接收到。并且重试机制不会生效（因为客户端不知道故障了没有）。每个消息返回的offset始终设置为-1。

acks=1，这意味着leader写入消息到本地日志就立即响应，而不等待所有follower应答。在这种情况下，如果响应消息之后但follower还未复制之前leader立即故障，那么消息将会丢失。

acks=all 这意味着leader将等待所有副本同步后应答消息。此配置保障消息不会丢失。这是最强壮的可用性保障。等价于acks=-1。

kafka 高可靠的更多相关文章

Kafka到底有多高可靠？（RNG NB）
在聊Kafka高可靠之前,先在评论区来波RNG NB好不好! 什么叫可靠性? 大家都知道,系统架构有三高:「高性能.高并发和高可用」,三者的重要性不言而喻. 对于任意系统,想要同时满足三高都是一件非常 ...
Kafka 高可用设计
Kafka 高可用设计 2016-02-28 杜亦舒 Kafka在早期版本中,并不提供高可用机制,一旦某个Broker宕机,其上所有Partition都无法继续提供服务,甚至发生数据丢失对于分布式系统 ...
腾讯云分布式高可靠消息队列服务CMQ架构
在分布式大行其道的今天,我们在系统内部.平台之间广泛运用消息中间件进行数据交换及解耦.CMQ是腾讯云内部自研基于的高可靠.强一致.可扩展分布式消息队列,在腾讯内部包括微信手机QQ业务红包.腾讯话费充值 ...
基于Raft深度优化，腾讯云金融级消息队列CMQ高可靠算法详解
背景介绍分布式系统是指一组独立的计算机,通过网络协同工作的系统,客户端看来就如同单台机器在工作.随着互联网时代数据规模的爆发式增长,传统的单机系统在性能和可用性上已经无法胜任,分布式系统具有扩展性强 ...
Kafka高可用实现原理
数据存储格式 Kafka的高可靠性的保障来源于其健壮的副本(replication)策略.一个Topic可以分成多个Partition,而一个Partition物理上由多个Segment组成. Seg ...
Kafka高可用实现
数据存储格式 Kafka的高可靠性的保障来源于其健壮的副本(replication)策略.一个Topic可以分成多个Partition,而一个Partition物理上由多个Segment组成. Seg ...
腾讯云分布式高可靠消息队列CMQ架构
版权声明:本文由张浩原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/126 来源:腾云阁 https://www.qclou ...
使用Kafka建立可靠的高性能分布式消息传递基础结构
在优锐课学习中了解到,我们可以看到实施资源适配器以将Kafka与企业Java解决方案集成.码了很多专业的相关知识, 分享给大家参考学习. 由于世界已经变得移动化,因此应用程序现在必须实时提供数据. 不 ...
最详细的hadoop2.2.0集群的HA高可靠的最简单配置
简介 [from http://www.open-open.com/lib/view/open1390717631132.html] hadoop中的NameNode好比是人的心脏,非常重要,绝对不可 ...

随机推荐

c++下使用邮槽实现进程间通信
Windows API提供了邮槽和命名管道两种机制来实现进程间通信,在这里使用C++实现邮槽. 邮槽是Windows提供的一种进程间单向通信的机制,进程中的一方只能读取(或写入)数据,而另一方只能写入 ...
[AirFlow]AirFlow使用指南二 DAG定义文件
1. Example """ Code that goes along with the Airflow tutorial located at: https://git ...
[置顶] AI大行其道，你准备好了吗？—谨送给徘徊于转行AI的程序员
前言近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个IT界.所有的互联网公司,尤其是 Google 微软,百度,腾讯等巨头,无不在布 ...
charles抓包--手机端
Fiddler和charles都是抓包工具,可以抓到pc端的请求,手机上设置代理后也可以抓到手机上的请求,也可以修改请求数据和返回的数据. 在接口已经使用的时候,比如说已经用到了app上,app端测试 ...
【angular之起步】安装
人生只有眼前的苟且. 所以为了远方,最近在策划一个大阴谋------做一个自己的网站,杂而全的. 各种胡思乱想了一周,先把页面写完了,没辙,就这个不用费太多脑子. 然后开始重头戏,就卡死了. angu ...
{Reship}{Sparse Representation}稀疏表示
===================================================== http://blog.sina.com.cn/s/blog_6d0e97bb01015wo ...
fpga配置过程（转载）
fpga 配置时序图如下 1.FPGA器件有三类配置下载方式:主动配置方式(AS)和被动配置方式(PS)和最常用的(JTAG)配置方式. AS 由FPGA器件引导配置操作过程, ...
借助CustomBehaviorsLibrary.dll写出水印效果（转）
在项目中载入这个dll 之后引用使用方法具体如下图: 在这里需要注意到是项目中对interactivity的引用 : 好文要顶关注我收藏该文
js中将时间(如：2017-10-8 22：44：55)转化为时间搓,时间戳转为标准格式时间
function split_time(time){//将当前时间转换成时间搓例如2013-09-11 12:12:12 var arr=time.split(" "); var ...
uGUI知识点剖析之RectTransform
http://www.2fz1.com/post/unity-ugui-recttransform/#jtss-tsina uGUI知识点剖析之RectTransform 一.基本要点 RectTra ...