常用的消息中间件 消息中间件是当前处理大数据的一个非常重要的组件,用来解决应用解耦.异步通信.流量控制等问题,从而构建一个高效.灵活.消息同步和异步传输处理.存储转发.可伸缩和最终一致性的稳定系统.目前业界应用比较多的分布式消息中间件主要包括:ActiveMQ.RabbitMQ.Kafka.RocketMQ,虽然都是分布式消息中间件,但是每种消息中间件使用方式区别还是很大的. ActiveMQ 优点:Apache开源,功能集全,文档多,历史悠久,支持多语言客户端,使用简单. 缺点:性能比较低.只…
1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多消息队列所采用的"插入-获取-删除"范式中,在把一个消息从队列中删除之前,需要你的处理系统明确的指出该消息已经被处理完毕,从而确保你的数据被安全的保存直到你使用完毕. 3.扩展性: 因为消息队列解耦了你的处理过程,所以增大消息入队和处理的频率是很容易的,只要另外增加处理过程即可. 4.灵活性&峰值处理…
Kafka作为新一代的消息系统,mq是比较成熟消息系统,而redis也可以发布订阅,那么这三者有何异同? RabbitMQ 是使用Erlang编写的一个开源的消息队列,本身支持很多的协议:AMQP,XMPP, SMTP, STOMP,也正是如此,使的它变的非常重量级,更适合于企业级的开发.同时实现了一个经纪人(Broker)构架,这意味着消息在发送给客户端时先在中排队.对路由(Routing),负载均衡(Load balance)或者数据持久化都有很好的支持. Redis 是一个Key-Valu…
作者:vivo 互联网服务器团队-Luo Mingbo 一.Kafka 集群部署架构 为了让读者能与小编在后续的问题分析中有更好的共鸣,小编先与各位读者朋友对齐一下我们 Kafka 集群的部署架构及服务接入 Kafka 集群的流程. 为了避免超大集群我们按照业务维度将整个每天负责十万亿级消息的 Kafka 集群拆分成了多个 Kafka 集群.拆分粒度太粗会导致单一集群过大,容易由于流量突变.资源隔离.限速等原因导致集群稳定性和可用性受到影响,拆分粒度太细又会因为集群太多不易维护,集群内资源较少应…
在高并发的应用场景中,由于来不及同步处理请求,接收到的请求往往会发生阻塞.例如,大量的插入.更新请求同时到达数据库,这会导致行或表被锁住,最后会因为请求堆积过多而触发“连接数过多的异常” 的错误.因此,在高并发的应用场景中需要一个缓冲机制,而消息队列则可以很好地充当这样一个角色.消息队列通过异步处理请求来缓解系统的压力. 什么是消息队列 “消息队列” (Message Queue, MQ)从字面来理解,是一个队列,拥有先进先出(FIFO)的特性.它主要用于不同进程或线程之间的通信,用来处理一系列…
背景介绍 分布式系统是指一组独立的计算机,通过网络协同工作的系统,客户端看来就如同单台机器在工作.随着互联网时代数据规模的爆发式增长,传统的单机系统在性能和可用性上已经无法胜任,分布式系统具有扩展性强.可用性高.廉价高效等优点得以广泛应用. 但与单机系统相比,分布式系统在实现上要复杂很多.CAP理论是分布式系统的理论基石,它提出以下3个要素: Consistency(强一致性):任何客户端都可以访问到同一份最新的数据副本. Availability(可用性): 系统一直处于可服务状态,每次请求都…
一.Kafka应用 本文主要总结当Kafka集群流量达到 万亿级记录/天或者十万亿级记录/天  甚至更高后,我们需要具备哪些能力才能保障集群高可用.高可靠.高性能.高吞吐.安全的运行. 这里总结内容主要针对Kafka2.1.1版本,包括集群版本升级.数据迁移.流量限制.监控告警.负载均衡.集群扩/缩容.资源隔离.集群容灾.集群安全.性能优化.平台化.开源版本缺陷.社区动态等方面.本文主要是介绍核心脉络,不做过多细节讲解.下面我们先来看看Kafka作为数据中枢的一些核心应用场景. 下图展示了一些主…
2019-04-09 关键词: 消息队列.为什么使用消息队列.消息队列的好处.消息队列的意义.Kafka是什么 本篇文章系本人就当前所掌握的知识关于 消息队列 与 kafka 知识点的一些简要介绍,不保证文章所述内容的绝对.完全正确性. 1.消息队列于消息系统的意义 笔者这里所提到的 消息系统 可不是那些社交网站上用于站内交流的消息系统. 在互联网中,但凡涉及到消息传递的过程,都可以称之为是一个消息系统,规模或大或小而已.举个例子:12306 购票过程就包含了消息系统,客户的查询.下单等请求都被…
一.kafka一个最基本的架构认识 由多个broker组成,每个broker就是一个节点:创建一个topic,这个topic可以划分为多个partition,每个partition可以存在于不同的broker上,每个partition存放放一部分数据. kafka就是一个分布式消息队列,就是说一个topic的数据,是分散放在多个机器上的,每个机器就放一部分数据. 实际上像rabbitmq之类的,并不是分布式消息队列,它只是传统的消息队列,只不过提供了一些集群.HA的机制而已,因为rabbitmq…
Kafka其实只是众多消息队列中的一种,对于Kafka的具体释义我这里就不多说了,详见:http://baike.baidu.com/link?url=HWFYszYuMdP_lueFH5bmYnlmH--SlsarbzE1CcfMi9JqeQBR77jCu30MubmAyBqqOSSZy9qfnrp5y5a_8wYota 想要下载Kafka可以直接上官网:http://kafka.apache.org/ (强烈建议一定要上官网下载,其它地方下载的可能有问题) Kafka下载成功之后,在libs…