kafka2 简单介绍
kafka是JMS的一种实现
JMS(java message service):middle ware,中间件技术。
Queue:队列模式,P2P,点对点。
publish-subscribe:主题模式,发布订阅模式。
消息中间件具体了解点这里。
kafka--分布式流计算平台
类似于消息系统发布订阅数据流。
以分布式、副本集群方式存储数据流。
实时处理数据流。
构建实时数据流管道,水平可伸缩,容错,速度快。
kafka特点
1.巨量数据:TB级
2.高吞吐量:支持每秒百万消息
3.分布式:支持在多个server之间进行消息分区
4.多客户端支持:和多语言进行协同。
kafka是消息系统,组件
zk //协同系统
broker //代理,即kafka server,并不维护哪个消费者消费了消息
producter //生产者
consumer //消费者,维护了消费的消息状态
consumer group //消费者组,每个组中只有一个消费者可以消费消息。
topic //主题
kafka的核心设计
1.消息缓存于FileSystem的存储,数据被即刻写入OS内核页,并缓存以及清理磁盘(可以配置)。
2.消息被消费后,kafka长时间驻留消息,如有必要,可以实现重复消费。
3.对分组消息使用消息set,防止网络过载。
4.不像大多数消息系统那样,将消费消息的元数据保存在server,而是将其保存在消费者。这样可以解决一些问题,比如:松散消息导致出错;相同消息的多次分发。
5.消费者状态默认存在zk中,也可以存在其它的OLTP中。
6.kafka中的生产和消费是push-and-pull模式(推拉模式,生产者push消息到broker中,消费者从broker中pull消息出来)。
7.kafka没有主从模式,所有broker地位相同,broker数据均在zk中维护,并在producter和consumer中共享。
8.kafka的LB(load balance,负载均衡)策略允许producer动态发现broker。
9.producer维护了broker的连接池,并能够通过zk的watcher call机制实时进行更新。
10.producer可以选择同步或异步的方式向broker发送消息。
消息压缩
1.producer压缩消息(GZIP + snappy),consumer解压缩。
2.压缩的消息没有深度限制。
3.在message的header中有一个compression byte来区分消息是否被压缩,这个压缩字节的低2位代表压缩类型,值为0表示未压缩。
4.消息压缩机制对于使用kafka进行跨数据中心建立数据镜像非常有用,压缩格式可以降低网络带宽,使一个active数据中心能向一个passive数据中心传输大量数据。
kafka镜像
将源集群的数据副本化到target kafka集群
kafka2 简单介绍的更多相关文章
- [原创]关于mybatis中一级缓存和二级缓存的简单介绍
关于mybatis中一级缓存和二级缓存的简单介绍 mybatis的一级缓存: MyBatis会在表示会话的SqlSession对象中建立一个简单的缓存,将每次查询到的结果结果缓存起来,当下次查询的时候 ...
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
- 利用Python进行数据分析(4) NumPy基础: ndarray简单介绍
一.NumPy 是什么 NumPy 是 Python 科学计算的基础包,它专为进行严格的数字处理而产生.在之前的随笔里已有更加详细的介绍,这里不再赘述. 利用 Python 进行数据分析(一)简单介绍 ...
- yii2的权限管理系统RBAC简单介绍
这里有几个概念 权限: 指用户是否可以执行哪些操作,如:编辑.发布.查看回帖 角色 比如:VIP用户组, 高级会员组,中级会员组,初级会员组 VIP用户组:发帖.回帖.删帖.浏览权限 高级会员组:发帖 ...
- angular1.x的简单介绍(二)
首先还是要强调一下DI,DI(Denpendency Injection)伸手获得,主要解决模块间的耦合关系.那么模块是又什么组成的呢?在我看来,模块的最小单位是类,多个类的组合就是模块.关于在根模块 ...
- Linux的简单介绍和常用命令的介绍
Linux的简单介绍和常用命令的介绍 本说明以Ubuntu系统为例 Ubuntu系统的安装自行百度,或者参考http://www.cnblogs.com/CoderJYF/p/6091068.html ...
- iOS-iOS开发简单介绍
概览 终于到了真正接触IOS应用程序的时刻了,之前我们花了很多时间去讨论C语言.ObjC等知识,对于很多朋友而言开发IOS第一天就想直接看到成果,看到可以运行的IOS程序.但是这里我想强调一下,前面的 ...
- iOS开发多线程篇—多线程简单介绍
iOS开发多线程篇—多线程简单介绍 一.进程和线程 1.什么是进程 进程是指在系统中正在运行的一个应用程序 每个进程之间是独立的,每个进程均运行在其专用且受保护的内存空间内 比如同时打开QQ.Xcod ...
- iOS开发UI篇—UITabBarController简单介绍
iOS开发UI篇—UITabBarController简单介绍 一.简单介绍 UITabBarController和UINavigationController类似,UITabBarControlle ...
随机推荐
- [Hinton] Neural Networks for Machine Learning - RNN
Link: Neural Networks for Machine Learning - 多伦多大学 Link: Hinton的CSC321课程笔记 补充: 参见cs231n 2017版本,ppt写得 ...
- [Laravel] 05 - Controller
大纲 PHP章节貌似有类似功能,回头看下. 请求 URL 一.URL 处理方法 请求使用的是:symfony/http-foundation组件 $_GET, $_POST, $_COOKIE, $_ ...
- Tiobe最新编程语言排行
https://www.tiobe.com/tiobe-index/
- Android Selinux
https://blog.csdn.net/rikeyone/article/details/84337115 如何快速定位SElinux问题并修复? https://blog.csdn.net/ ...
- MYSQL 如何完全卸载数据库
有时候MySQL不能完全卸载,这时候必须通过一些途径删除掉注册表和一些残余的文件,然后才能重新安装才可以成功! 1.控制面板——>所有控制面板项——>程序和功能,卸载mysql serve ...
- JVM内存GC的骗局——JVM不抛出OOM但内存已经泄露
概述 在日常测试中,我们会去重点观察java的内存使用情况,比如:进程会抛出OOM异常,不再接收新的请求:响应时间在固定时间段内变长,超时或者不响应,CPU使用率时常像过山车一样等.有时候JVM还会发 ...
- python中的 set 中的元素
set存储的元素和dict的key类似,必须是不变对象,因此,任何可变对象是不能放入set中的.
- javascript中的数字玩法,颠覆你的眼睛
1.JavaScript中的数字中有一些很奇葩的现象. 在Chrome控制台中可以自己做一下实验: 1 === 1.0 ; //true 习惯了强类型语言,如java,c,OC看到这个结论还是有点小迷 ...
- Web开发——CSS基础
参考: 参考:http://css.doyoe.com/ 参考:http://www.w3school.com.cn/cssref/index.asp 参考:https://www.w3cschool ...
- json解析出来数据为空解决方法
从APP端或从其他页面post,get过来的数据一般因为数组形式.因为数组形式不易传输,所以一般都会转json后再发送.本以为发送方json_encode(),接收方json_decode(),就解决 ...