为什么是kafka(二)

回答几个网友提出的问题，不清楚的能够看上一篇内容。

1、
kafka的删除策略应该怎么配置？为了提升性能。我是不是应该1小时删除一次消费过的数据。

全然能够依据磁盘大小配置。仅仅要磁盘足够用，全然不是必需删除的那么着急。Kafka的吞吐量不会由于数据量的增长而减少。由于读写数据时，kafka全然是顺序的，仅仅记录offset。时间复杂度是O（1）。我以前測试过上T的数据，全然不受影响。

反倒是数据删除的太快，easy造成数据丢失。

2、
消息发送一直失败。到达了指定重试次数怎么处理？

client能够设置重试次数和重试间隔时间，由于一般kafka是以集群形式存在的。一直重试都不能成功，并不多见，常见的情况是应用和kafka集群断网。实际上在重试的过程中，假设应用挂掉。这个消息就丢失了，假设要避免此种情况发生，须要持久化消息，当然能够选择本地持久化和远程持久化，选择本地持久化也不是很安全。由于如今的应用server很有可能是虚拟机或者容器。远程持久化相对安全。

可是远程意味着须要网络。假设恰巧远程持久化也失败，该怎么办？解决此类问题。最后的救命稻草就是日志。

这类问题并不仅仅是在mq中，入库也是一样。分布式场景中很常见。可是由于发生的概率不大，通常都被开发者忽略。这也就是做结算的永远都不能把账算平的原因所在。通常要权衡处理这种小概率事件是不是值得。

重要的系统通常有定时检查的功能。作为小概率事件的事后补偿机制。

3、
假设总副本数为f，最多同意丢失多少副本？

最多同意丢失f-1个副本，也就是仅仅要有一个副本就没问题。当然这和broker的配置有关。

从服务端角度，怎样尽快将更新后的数据分布到整个系统，减少达到终于一致性的时间窗体，是提高系统的可用度和用户体验很重要的方面。对于分布式数据系统：

a)
N — 数据复制的份数

b)
W — 更新数据是须要保证写完毕的节点数

c)
R — 读取数据的时候须要读取的节点数

不论什么一个分布式系统，在服务端。要想保持强一致性。必须符合W+R>N。也就是说，如果一共同拥有3个节点。写数据的时候，三个节点都写入成功才返回，仅仅要有一个节点存活，就能保证数据是最新的。

4、
Kafka是有顺序的吗？

在同一个partition全然是有顺序的。生产者能够设置分区策略，能够自己定义分区策略，这样就能够依据业务分区。

举个样例，假设是跟用户相关的。全然能够依据用户id进行分区，同样用户的全部操作都进入同一个分区。也就达到了顺序性。

当然，有顺序也是有害处的，有顺序就意味着堵塞。假设消费一条消息一直失败。消费过程会受到堵塞，灵活的处理方式是重试到一定次数，把这条消息持久化到远端，跳过这条消息继续消费。

也就意味着失去了顺序。

为什么是kafka(二)的更多相关文章

spark streaming 整合kafka(二)
转载:https://www.iteblog.com/archives/1326.html 和基于Receiver接收数据不一样,这种方式定期地从Kafka的topic+partition中查询最新的 ...
Kafka(二） —— Server端设计原理
整理架构 kafka confluence kafka官方文档中文翻译-设计消息设计 /** * 消息类 * * @author Michael Fang * @since 2019-11-14 * ...
Kafka学习笔记
一.Kafka使用背景 1. Kafka的定义是一个分布式消息系统,由LinkedIn使用Scala编写,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipel ...
使用sparksql往kafka推送数据
一.相关配置参数 1.同级目录resource文件夹下配置 brokers_list=kafkaxxx02broker01:9092,kafkaxxx02broker02:9092,kafkaxxx0 ...
Apache kafka v1.0.0 部署文档
简介: Apache Kafka 是一个 Scala 语言编写的可扩展.分布式.高性能的容错消息发布.订阅系统. 官网地址:http://kafka.apache.org 中文教程:http://ww ...
八、Kafka总结
一 Kafka概述 1.1 Kafka是什么在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算. 1)Apache Kafka是一个开源消息系统,由Scala写成. ...
五 akka streams kafka
(转载 https://doc.akka.io/docs/akka-stream-kafka/current/home.html) 一: Akka Streams Kafka, also known ...
Kafka学习笔记4--Kafka消费者的客户端（PHP）开发
一.准备工作虽然 Kafka 是用 Java/Scala 语言编写的,但这不妨碍它对多语言的支持.可以在 Kafka 官网的 CLIENTS 查看 Kafka 支持的语言,其中包括 C/C++.Py ...
【Kafka】监控及运维——kafka-eagle
目录简单介绍概述安装部署一.环境要求二.下载源码包并解压三.准备数据库四.修改配置文件五.配置环境变量六.启动kafka-eagle 七.成功运行简单介绍概述 Kafka-eag ...

随机推荐

了解一下运行软件的自我保护(RASP)
看下这篇文章: http://www.jianshu.com/u/c89141b2d51e 相应的demo演示: https://github.com/xbeark/javaopenrasp
【Hadoop】三句话告诉你 mapreduce 中MAP进程的数量怎么控制？
1.果断先上结论 1.如果想增加map个数,则设置mapred.map.tasks 为一个较大的值. 2.如果想减小map个数,则设置mapred.min.split.size 为一个较大的值. 3. ...
MVC EasyUI 时间格式化
用 return Json(dr, JsonRequestBehavior.AllowGet); 会返回一个json 数据格式,在用 EasyUI 输出表格内容时会遇到时间输出不是我们想要的格式, ...
【共享单车】—— React后台管理系统开发手记：Redux集成开发
前言:以下内容基于React全家桶+AntD实战课程的学习实践过程记录.最终成果github地址:https://github.com/66Web/react-antd-manager,欢迎star. ...
java学习笔记——大数据操作类
java.math包中提供了两个大数字操作类:BigInteger(大整数操作类) BigDecimal(大小数操作类). 大整数操作类:BigInteger BigInteger类构造方法:publ ...
psql命令行快速参考
psql的命令语法是: psql [options] [dbname [username]] psql命令行选项以及它们的意思在表1-1中列出.使用以下命令可以看到psql完整的选项列表: $ psq ...
Android 创建Listener监听器形式选择:匿名内部类?外部类?
说到监听器,第一感觉就是直接写作匿名内部类来用,可是依据单一职责原则,好像又不应该作为匿名内部类来写(由于监听中有时要写较多的逻辑代码),所曾经段时间把有共性的listener单独创建放在glut.l ...
关于汉诺塔，C++代码，代码效果演算
1．故事介绍汉诺塔:汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具.大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上依照大小顺序摞着64片黄金圆盘.大梵天命令婆罗门把圆盘 ...
Burp Suite Intruder的4种攻击类型
位置:Intruder>1(通常为数字)>Positions,Attack Type下拉有四种,分别为一.Sniper(狙击手模式) 狙击手模式使用一组payload集合,它一次只使用一 ...
如何为Apache JMeter开发插件（二）—第一个JMeter插件
文章内容转载于:http://lib.csdn.net/article/softwaretest/25700,并且加上个人一些截图本篇将开启为JMeter开发插件之旅,我们选择以Function(函 ...

为什么是kafka(二)

为什么是kafka(二)的更多相关文章

随机推荐

热门专题