消息存储

消息存储方式

非持久化

  1. 消息生成者发送消息到 MQ

  2. MQ 返回 ACK(Acknowledge Character)给生产者

  3. MQ push 消息给对应的消费者

  4. 消息消费者返回 ACK 给 MQ

持久化

  1. 消息生成者发送消息到 MQ

  2. MQ 收到消息,将消息进行持久化,存储该消息

  3. MQ 返回 ACK 给生产者

  4. MQ push 消息给对应的消费者

  5. 消息消费者返回 ACK 给 MQ

  6. MQ 删除消息

注意:

①第 5 步 MQ 在指定时间内接到消息消费者返回 ACK,MQ 认定消息消费成功,执行 6 。

②第 5 步 MQ 在指定时间内未接到消息消费者返回 ACK,MQ 认定消息消费失败,重新执行 4、5、6 。

消息存储介质

数据库

  • 实现:ActiveMQ

  • 缺点:数据库瓶颈将成为 MQ 瓶颈

文件系统

  • 实现:RocketMQ/Kafka/RabbitMQ

  • 解决方案:采用消息刷盘机制进行数据存储

  • 缺点:硬盘损坏的问题无法避免

消息存储与读写方式

SSD(Solid State Disk):固态硬盘

  • 随机写(100 KB/s)

  • 顺序写(600 MB/s):1秒1部电影

Linux 系统发送数据的方式

  • “零拷贝”技术

    • 数据传输由传统的 4 次复制简化成 3 次复制,减少 1 次复制过程
    • Java 语言中使用 MappedByteBuffer 类实现了该技术
    • 要求:预留存储空间,用于保存数据(1G 存储空间起步)

消息存储结构

如图所示,MQ 数据存储区域包含如下内容:

  • 消息数据存储区域

    • topic
    • queueId
    • message
  • 消费逻辑队列
    • minOffset
    • maxOffset
    • consumerOffset
  • 索引
    • key 索引
    • 创建时间索引
    • ……

刷盘机制

同步刷盘

  1. 生产者发送消息到 MQ,MQ 接到消息数据

  2. MQ 挂起生产者发送消息的线程

  3. MQ 将消息数据写入内存

  4. 内存数据写入硬盘

  5. 磁盘存储后返回 SUCCESS

  6. MQ 恢复挂起的生产者线程

  7. 发送 ACK 到生产者

异步刷盘

  1. 生产者发送消息到 MQ,MQ 接到消息数据

  2. MQ 将消息数据写入内存

  3. 发送 ACK 到生产者

小结

  • 同步刷盘:安全性高,效率低,速度慢(适用于对数据安全要求较高的业务)
  • 异步刷盘:安全性低,效率高,速度快(适用于对数据处理速度要求较高的业务)
# 刷盘方式
#- ASYNC_FLUSH 异步刷盘
#- SYNC_FLUSH 同步刷盘
flushDiskType=SYNC_FLUSH

高可用

高可用实现

nameserver

  • 无状态 + 全服务器注册

消息服务器

  • 主从架构(2M-2S)

消息生产

  • 生产者将相同的 topic 绑定到多个 group 组,保证即使 broker master 挂掉,其他 master 仍可正常进行消息接收。

消息消费

  • RocketMQ 自身会根据 broker master 的压力确认是否由 master 承担消息读取的功能,当 master 繁忙时候,自动切换由 slave 承担数据读取的工作。

主从复制

同步复制

  • master 接到消息后,先复制到 slave,然后反馈给生产者写操作成功
  • 优点:数据安全,不丢数据,出现故障容易恢复
  • 缺点:影响数据吞吐量,整体性能低

异步复制

  • master 接到消息后,立即返回给生产者写操作成功,当消息达到一定量后再异步复制到slave
  • 优点:数据吞吐量大,操作延迟低,性能高
  • 缺点:数据不安全,会出现数据丢失的现象,一旦 master 出现故障,从上次数据同步到故障时间的数据将丢失

配置方式

#Broker 的角色
#- ASYNC_MASTER 异步复制Master
#- SYNC_MASTER 同步双写Master
#- SLAVE
brokerRole=SYNC_MASTER

负载均衡

Producer 负载均衡:

  • 内部实现了不同 broker 集群中对同一 topic 对应消息队列的负载均衡

Consumer 两种负载均衡策略

  • 平均分配

  • 循环平均分配

消息重试

当消息消费后未正常返回消费成功的信息将启动消息重试机制

两种消息重试机制:

  • 顺序消息重试

  • 无序消息重试

顺序消息重试

  • 当消费者消费消息失败后,RocketMQ 会自动进行消息重试(每次间隔时间为 1 秒)。
  • 注意:应用会出现消息消费被阻塞的情况,因此,要对顺序消息的消费情况进行监控,避免阻塞现象的发生。

无序消息重试

  • 无序消息包括普通消息、定时消息、延时消息、事务消息。
  • 无序消息重试仅适用于负载均衡(集群)模型下的消息消费,不适用于广播模式下的消息消费。
  • 为保障无序消息的消费,MQ 设定了合理的消息重试间隔时长。

死信队列

概念

  • 当消息消费重试到达了指定次数(默认 16 次)后,MQ 将无法被正常消费的消息称为死信消息(Dead-Letter Message)。

  • 死信消息不会被直接抛弃,而是保存到了一个全新的队列中,该队列称为死信队列(Dead-Letter Queue)。

死信队列的特征

  • 归属某一个组(Gourp Id),而不归属 Topic,也不归属消费者。
  • 一个死信队列中可以包含同一个组下的多个 Topic 中的死信消息。
  • 死信队列不会进行默认初始化,当第一个死信出现后,此队列首次初始化。

死信队列中的消息的特征

  • 不会被再次重复消费。
  • 死信队列中的消息有效期为 3 天,达到时限后将被清除。

死信处理

  • 在监控平台中,通过查找死信,获取死信的 messageId,然后通过 id 对死信进行精准消费。

消息幂等

消息重复消费

消息重复消费原因

  • 生产者发送了重复的消息

    • 网络闪断
    • 生产者宕机
  • 消息服务器投递了重复的消息
    • 网络闪断
  • 动态的负载均衡过程
    • 网络闪断/抖动
    • broker重启
    • 订阅方应用重启(消费者)
    • 客户端扩容
    • 客户端缩容

消息幂等

对同一条消息,无论消费多少次,结果保持一致,称为消息幂等性

解决方案

  1. 使用业务 id 作为消息的 key 。

  2. 在消费消息时,客户端对 key 做判定,未使用过放行,使用过抛弃。

  • 注意:messageId 由 RocketMQ 产生,messageId 并不具有唯一性,不能作用幂等判定条件。

常见的幂等方法示例

  • 新增(不幂等):insert into order values(……)
  • 查询(幂等)
  • 删除(幂等):delete from 表 where id=1
  • 修改(不幂等):update account set balance = balance+100 where no=1
  • 修改(幂等):update account set balance = 100 where no=1

RocketMQ 原理:消息存储、高可用、消息重试、消息幂等性的更多相关文章

  1. Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理

    为什么使用消息队列 其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么? 面试官问你这个问题,期望的一个回答是说,你们公司有个什么业务场景,这个业务 ...

  2. MongoDB分片技术原理和高可用集群配置方案

    一.Sharding分片技术 1.分片概述 当数据量比较大的时候,我们需要把数分片运行在不同的机器中,以降低CPU.内存和Io的压力,Sharding就是数据库分片技术. MongoDB分片技术类似M ...

  3. rocketmq总结(消息的高可用、中间件选型)

    rocketmq总结(消息的高可用.中间件选型) 参考: https://blog.csdn.net/meilong_whpu/article/details/76922456 http://blog ...

  4. RocketMQ源码详解 | Broker篇 · 其五:高可用之主从架构

    概述 对于一个消息中间件来讲,高可用功能是极其重要的,RocketMQ 当然也具有其对应的高可用方案. 在 RocketMQ 中,有主从架构和 Dledger 两种高可用方案: 第一种通过主 Brok ...

  5. HBase高可用原理与实践

    前言 前段时间有套线上HBase出了点小问题,导致该套HBase集群服务停止了2个小时,从而造成使用该套HBase作为数据存储的应用也出现了服务异常.在排查问题之余,我们不禁也在思考,以后再出现类似的 ...

  6. 一套高可用、易伸缩、高并发的IM群聊架构方案设计实践

    本文原题为“一套高可用群聊消息系统实现”,由作者“于雨氏”授权整理和发布,内容有些许改动,作者博客地址:alexstocks.github.io.应作者要求,如需转载,请联系作者获得授权. 一.引言 ...

  7. EQueue 2.3.2版本发布(支持高可用)

    前言 前段时间针对EQueue的完善终于告一段落了,实在值得庆祝,自己的付出和坚持总算有了成果.这次新版本主要为EQueue实现了集群功能,基本实现了Broker的高可用.另外还增加了很多实用的功能, ...

  8. keepalived高可用简介与配置

    keepalived简介 keepalived介绍 Keepalived 软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP ...

  9. 高可用系列之Nginx

    1.1Keepalived高可用软件 Keepalived起初是专为LVS设计的,专门用来监控LVS集群系统中各个服务节点的状态,后来又加入了VRRP的功能,因此除了配合LVS服务外,也可以作为其他服 ...

  10. keepalived+nginx负载均衡+ApacheWeb实现高可用

    1.Keepalived高可用软件 Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能.因此,kee ...

随机推荐

  1. 合并项目(Project)

    <Project2016 企业项目管理实践>张会斌 董方好 编著 在熬肥的世界里,有个大难题,就是多文件合并-- 好吧,以前是大难题,现在,早就不是了,Word有主控文档,Excel有&q ...

  2. CF1199B Water Lily 题解

    Content 有一朵长在水中的莲花,其茎秆部分露出水面的高度为 \(h\).有人将它往右边拽了 \(l\) 米,使得整个茎秆部分都浸在水中.求池水的深度. 数据范围:\(1\leqslant h&l ...

  3. 使用Redis+自定义注解实现接口防刷

    最近开发了一个功能,需要发送短信验证码鉴权,考虑到短信服务需要收费,因此对此接口做了防刷处理,实现方式主要是Redis+自定义注解(需要导入Redis的相关依赖,完成Redis的相关配置,gs代码,这 ...

  4. js Uncaught TypeError: undefined is not a function

    如下代码: var columns={}; var column={}: column.name='张三'; columns.push(column); 会出现Uncaught TypeError: ...

  5. Linux(centos)使用docker安装pdf2htmlEX

    pdf2htmlEX是一款可以将pdf文档转换成html文件的插件,但是Linux系统安装起来很麻烦,所以我们使用docker进行安装 首先要安装docker 因为国外镜像很慢,所以我们这边修改使用国 ...

  6. 【九度OJ】题目1190:大整数排序 解题报告

    [九度OJ]题目1190:大整数排序 解题报告 标签(空格分隔): 九度OJ 原题地址:http://ac.jobdu.com/problem.php?pid=1190 题目描述: 对N个长度最长可达 ...

  7. 【LeetCode】941. Valid Mountain Array 解题报告(Python)

    作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 日期 题目地址:https://leetcode.c ...

  8. 【LeetCode】363. Max Sum of Rectangle No Larger Than K 解题报告(Python)

    作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 题目地址: https://leetcode.com/problems/max-sum- ...

  9. 1016 - Brush (II)

    1016 - Brush (II)    PDF (English) Statistics Forum Time Limit: 2 second(s) Memory Limit: 32 MB Afte ...

  10. Codeforces 567D:One-Dimensional Battle Ships(二分)

    time limit per test : 1 second memory limit per test : 256 megabytes input : standard input output : ...