MQ系列1:消息中间件执行原理

MQ系列2:消息中间件的技术选型

MQ系列3:RocketMQ 架构分析

MQ系列4:NameServer 原理解析

MQ系列5:RocketMQ消息的发送模式

在之前的文章中,我们学习了RocketMQ的原理;RocketMQ中 命名服务 ServiceName 的运行流程;以及消息生产、发送的原理和模式。这一篇,就让我们从消息消费的角度去进一步的学习。

1 消息消费

消息的消费主要是由如下几个核心能力组成的:

  • 消费方式:Push(推) 或者 Pull(拉)
  • 消费模式:广播模式和集群模式
  • 消息消费反馈
  • 流量控制(包括消费并发线程数设置)
  • 消息的过滤(Tag, Key),过滤标签 TagA||TagB||TagC

1.1 消费方式Push or Pull

RocketMQ消息订阅有方式:

  • Push方式(MQPushConsumer),MQ Server主动向消费端推送;

    这种模式不考虑消费端是否有能力处理消费数据,实时性比较高,能够及时推送数据,适合大部分业务场景。但同时存在一个问题,如果遇到峰值期,瞬间推送过多消息,会导致积压,甚至客户端雪崩。
  • Pull方式(MQPullConsumer),消费端在有需要时,主动从MQ Server拉取数据。

    消费端比较灵活,可以根据自己的吞吐能力,消费的节奏,主动安排消息拉取。适合消费和计算耗时比较大的消费场景。

    缺点就是如何从代码层面精准地控制拉取的频率,过短对消费端有压力,并且有可能空拉照成资源拉菲;过长可能对消息及时性有影响,可以采用长轮询的方式进行处理。
  • Push模式与Pull模式的区别

    Push方式的做法是,Consumer封装了长轮询的操作,并注册MessageListener监听器,当MessageListener监听到有新的消息的时候,消费端便被唤醒,读取消息进行消费。从用户角度上,订阅消息并消费感觉消息是推过来的。

    Pull方式的做法是,消费端主动去拉取数据,获取相应的Topic的,遍历MessageQueue集合,取数,重新标记offset,再取数,直至消费完成。

1.2 消费模式 集群 or 广播

RocketMQ 目前支持集群模式和广播消费模式,其中集群模式使用范围比较大,即点对点,消息消费了即完成。

  • 集群负载均衡消费模式(默认)

    集群模式是一个主题下的单条消息只允许被同一消费组内的一个消费者消费,消费完即完成,即P2P。

    在集群模式下,消息队列负载的模式:一个MessageQueue集合同一个时间内只允许被同一消费组内的单个消费者消费一次(这种模式不允许重复消费,如付款,订单提交),单个Consumer可以消费多个遍历MessageQueue集合。
  • 广播消费模式

    广播模式指的是当前主题下的消费组所有消费者都可以消费并处理消息一次,达到广播的目的。很多业务场景,比如航班延迟的消息通知,告知客户端缓存信息过期需要重新拉起等。

1.3 消费进度反馈

RocketMQ客户端消费数据之后,需要向Broker反馈消息的消费进度,Broker获取到消费进度记录下来。这样保证 队列rebalance和客户端消费者重启动的时候,可以获取到准确的消费进度。

消息消费以及进度反馈的主步骤如下:

  • 消费线程池消费完数据之后,将消息消费进度缓存在内存中。
  • 定时调度任务 5s 一次将消息队里的消费 offset 提交至Broker。
  • Broker接受到消息之后,存储在内存中,如果有新的过来,可以更行,同样的每5s将offset持久化下来。
  • 消费客户端从Broker拉取消息时,同步将MessageQueue的消费偏移量提交到Broker。

综合上面的内容,需要注意的点如下:

  • RocketMQ以Consumer Group(消费者小组)和 Queue(队列)为标准对消费刻度进行管理的
  • Consumer Offset标记消费组在消息队列(Queue)上的消费进度。
  • 消费成功后,消费进度暂时更新到本地缓存,调度任务会定时(默认5s)将进度同步到broker(需注意如果宕机,消费进度未提交则可能导致被重复消费),Broker最终将消费进度持久化到磁盘。
  • RocketMQ支持并发消费,所以是多个线程并行处理,每次记录消费进度的时候,把线程中最小的offset值作为消费进度值,这样避免了消息丢失,但有重复消费的风险,业务中需保证操作幂等性。
  • offset存储模式:集群模式,消息进度存储于Broker上;广播模式,消息消费进度在消费端即可。

1.4 消费端流量控制

可以在DefaultMQPushConsumer 对象中配置各种属性来对消费流量进行控制:

  • PullInterval: 配置消费端拉取MQ消息的间隔时间。间隔时间是按照上次消费完成之后(比如rocketMQ收到Ack回复消息之后)。

    PullInterval=20s,比如上次rocketMq服务收到Ack消息是12:15:15,则 12:15:35再去拉消息。

  • PullBatchSize: 消费端每个队列一次拉取多少个消息,若该消费端分赔了N个监控队列,每次拉取M个,那么消费端每次去rocketMq拉取的消息为N * M。

    消费端每次pull到消息总数=PullBatchSize * 监听队列数,如 PullBatchSize = 2, 监听队列=5,则 消息总数量 = 2 * 5 = 10。

  • ThreadMin和ThreadMax: 消费端消费pull到的消息需要的线程数量。

    • ThreadMin:消费端拉取到消息后分配消费的线程数
    • ThreadMax:最大消费线程,如果默认队列满了,则启用新的线程
  • RocketMq 逻辑消费队列数量的配置

    rocketMq 可以配置消费队列,如 queue Read1 ,queue Read2,配置数量决定每次pull到的消息总数。Rocket MQ 提供了读写队列数量的配置。

  • 消费端节点部署数量

    多节点消费端线程数量要比单节点消费线程数量多,理论上消费速度大于单节点,分治思维。

1.5 消息的过滤

在过滤消息的时候,标签模式简单而是用,可以筛选出你需要的数据。如下:

DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("groupTest");
consumer.subscribe("testTopic", MessageSelector.byTag("Tag1 || Tag2 || Tag3").bySql("sex = 'male' AND name = 'brand'));

这种情况下,消息中带有 Tag1 、Tag2、Tag3 标签就会被过滤出来,但是单个消限制息只能有一个标签,这就远远满足不了各种复杂的并交集场景的需要了。

这时候Rocket MQ可以在消息中设置一些属性,再使用SQL表达式筛选属性来过滤出需要的数据。 如下

------------
| message |
|----------| sex = male AND name = 'brand' , Gotten
| name = 'brand' |
| sex = 'male'|
| age = 21|
------------ ------------
| message |
|----------| sex = male AND name = 'brand', Gotten , Missed
| name = 'Anny' |
| sex = 'female'|
| age = 20 |
------------

1.8 提高Consumer的处理能力 :看情况

  1. 提高消费并行度

    在同一个ConsumerGroup下(Clustering方式),可以通过增加Consumer实例的数量来提高并行度。

    通过加机器,或者在已有机器中启动多个Consumer进程都可以增加Consumer实例数。

    注意:总的Consumer数量不要超过Topic下Read Queue数量,超过的Consumer实例接收不到消息。

    此外,通过提高单个Consumer实例中的并行处理的线程数,可以在同一个Consumer内增加并行度来提高吞吐量(设置方法是修改consumeThreadMin和consumeThreadMax)。

  2. 以批量方式进行消费

    某些业务场景下,多条消息同时处理的时间会大大小于逐个处理的时间总和,比如消费消息中涉及update某个数据库,一次update10条的时间会大大小于十次update1条数据的时间。

    可以通过批量方式消费来提高消费的吞吐量。实现方法是设置Consumer的consumeMessageBatchMaxSize这个参数,默认是1,如果设置为N,在消息多的时候每次收到的是个长度为N的消息链表。

  3. 检测延时情况,跳过非重要消息

    Consumer在消费的过程中,如果发现由于某种原因发生严重的消息堆积,短时间无法消除堆积,这个时候可以选择丢弃不重要的消息,使Consumer尽快追上Producer的进度。

2 消息消费的模式

2.1 基本信息消费

消费者的基本实现,连接 NameServer的地址,指定Topic和Tag,读取到需要消费的数据,然后轮询并处理。

public class SimpleConsumerApplication {
public static void main(String[] args) throws MQClientException {
// 1.创建消费者Consumer,并指定消费者组名为 testConsumGroup
DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("testConsumGroup");
// 2.指定NameServer的地址,以获取Broker路由地址
consumer.setNamesrvAddr("192.168.139.1:9876");
// 3.指定Topic和Tag 信息。* 代表所有
consumer.subscribe("testTopic", "*"); // 4.设置回调函数,用来处理读取到的消息, MessageListenerOrderly 用单个线程处理处理队列的数据
consumer.registerMessageListener(new MessageListenerOrderly() {
@Override
public ConsumeOrderlyStatus consumeMessage(List<MessageExt> msgList, ConsumeOrderlyContext context) {
for (MessageExt msg : msgList) {
System.out.println("线程 " + Thread.currentThread().getName() + " : " + msg.getBody().toString());
// Todo,具体的业务逻辑
}
return ConsumeOrderlyStatus.SUCCESS;
}
});
// 5.消费者开始执行消费任务
consumer.start();
}
}

2.2 顺序消费

相比与基本消费,多了一个 ConsumeFromWhere的设置。代表消费者从哪个位置开始消费,枚举如下:

  • CONSUME_FROM_LAST_OFFSET:第一次启动从队列最后位置消费,非第一次启动接着上次消费的进度继续消费
  • CONSUME_FROM_FIRST_OFFSET:第一次启动从队列初始位置消费,非第一次启动接着上次消费的进度继续消费
  • CONSUME_FROM_TIMESTAMP:第一次启动从指定时间点位置消费,非第一次启动接着上次消费的进度继续消费

    以上所说的第一次启动是指从来没有消费过的消费者,如果该消费者消费过,那么会在broker端记录该消费者的消费位置,消费者挂了再启动,则从上次消费进度继续执行。
public class SimpleOrderApplication {
public static void main(String[] args) throws MQClientException {
// 1.创建消费者Consumer,并指定消费者组名为 testConsumGroup
DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("testConsumGroup");
// 2.指定NameServer的地址,以获取Broker路由地址
consumer.setNamesrvAddr("192.168.139.1:9876"); /**
* 设置Consumer第一次启动是从队列头部、队列尾部、还是指定时间戳节点开始消费
* 非第一次启动接着上次消费的进度继续消费
*/
consumer.setConsumeFromWhere(ConsumeFromWhere.CONSUME_FROM_FIRST_OFFSET); // 3.指定Topic和Tag 信息。* 代表所有
consumer.subscribe("testTopic", "*"); // 4.设置回调函数,用来处理读取到的消息, MessageListenerOrderly 用单个线程处理处理队列的数据
consumer.registerMessageListener(new MessageListenerOrderly() {
@Override
public ConsumeOrderlyStatus consumeMessage(List<MessageExt> msgList, ConsumeOrderlyContext context) {
for (MessageExt msg : msgList) {
System.out.println("线程 " + Thread.currentThread().getName() + " : " + msg.getBody().toString());
// Todo,具体的业务逻辑
}
return ConsumeOrderlyStatus.SUCCESS;
}
});
// 5.消费者开始执行消费任务
consumer.start();
}
}

2.3 过滤消息消费

可以使用MessageSelector.byTag来进行标签筛选;或者使用MessageSelector.bySql 来进行消息属性筛选;或者混合使用。

参考下面代码,注释说明的比较清楚。

public class FilterConsumerApplication {
public static void main(String[] args) throws MQClientException {
// 1.创建消费者Consumer,并指定消费者组名为 testConsumGroup
DefaultMQPushConsumer consumer = new DefaultMQPushConsumer("testConsumGroup");
// 2.指定NameServer的地址,以获取Broker路由地址
consumer.setNamesrvAddr("192.168.139.1:9876"); // 3.指定Topic和Tag 信息。只有订阅的消息有 sex 和 name 属性, 并且年龄为 18 岁以上的男性
// consumer.subscribe("testTopic", MessageSelector.byTag("userTag1 || userTag2"));
consumer.subscribe("testTopic", MessageSelector.bySql("sex = 'male' AND age > 18")); // 4.设置回调函数,用来处理读取到的消息, MessageListenerOrderly 用单个线程处理处理队列的数据
consumer.registerMessageListener(new MessageListenerOrderly() {
@Override
public ConsumeOrderlyStatus consumeMessage(List<MessageExt> msgList, ConsumeOrderlyContext context) {
for (MessageExt msg : msgList) {
System.out.println("线程 " + Thread.currentThread().getName() + " : " + msg.getBody().toString());
// Todo,具体的业务逻辑
}
return ConsumeOrderlyStatus.SUCCESS;
}
});
// 5.消费者开始执行消费任务
consumer.start();
}
}

3 总结

  • 消费方式:Push(推) 或者 Pull(拉)
  • 消费模式:广播模式和集群模式
  • 消息消费反馈
  • 流量控制(包括消费并发线程数设置)
  • 消息的过滤(Tag, Key),过滤标签 TagA||TagB||TagC

MQ系列6:消息的消费的更多相关文章

  1. 【SpringBoot MQ 系列】RabbitListener 消费基本使用姿势介绍

    [MQ 系列]RabbitListener 消费基本使用姿势介绍 之前介绍了 rabbitmq 的消息发送姿势,既然有发送,当然就得有消费者,在 SpringBoot 环境下,消费可以说比较简单了,借 ...

  2. MQ系列5:RocketMQ消息的发送模式

    MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 在之前的篇章中,我们学习了RocketMQ的原理, ...

  3. 【SpringBoot MQ 系列】RabbitMq 核心知识点小结

    [MQ 系列]RabbitMq 核心知识点小结 以下内容,部分取材于官方教程,部分来源网络博主的分享,如有兴趣了解更多详细的知识点,可以在本文最后的文章列表中获取原地址 RabbitMQ 是一个基于 ...

  4. 《吃透MQ系列》核心基础全在这里了

    这是<吃透XXX>技术系列的开篇,这个系列的思路是:先找到每个技术栈最本质的东西,然后以此为出发点,逐渐延伸出其他核心知识.所以,整个系列侧重于思考力的训练,不仅仅是讲清楚 What,而是 ...

  5. 日常Bug排查-消息不消费

    日常Bug排查-消息不消费 前言 日常Bug排查系列都是一些简单Bug排查,笔者将在这里介绍一些排查Bug的简单技巧,同时顺便积累素材_. Bug现场 某天下午,在笔者研究某个问题正high的时候.开 ...

  6. 《吃透MQ系列》之扒开Kafka的神秘面纱

    大家好,这是<吃透 MQ 系列>的第二弹,有些珊珊来迟,后台被好几个读者催更了,实属抱歉! 这篇文章拖更了好几周,起初的想法是:围绕每一个具体的消息中间件,不仅要写透,而且要控制好篇幅,写 ...

  7. MQ系列3:RocketMQ 架构分析

    MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 1 背景 我们前面两篇对主流消息队列的基本构成和技术选型做了详细的分析.从本篇开始,我们会专注当下主流MQ之一的RocketMQ. 从 ...

  8. MQ系列4:NameServer 原理解析

    MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 1 关于NameServer 上一节的 MQ系列3:RocketMQ 架构分析,我们大致介绍了 ...

  9. ActiveMQ消息的消费原理

    消费端消费消息: 在 初识ActiveMQ 中我提到过,两种方法可以接收消息,一种是使用同步阻塞的ActiveMQMessageConsumer#receive方法.另一种是使用消息监听器Messag ...

随机推荐

  1. 不同云服务器下,ubuntu下开k3s集群

    首先先感谢老哥的文章:h构建多云环境下的K3S集群,但是我尝试在centos 8.2上面前面一直执行报错 并且安装glibc 2.17时还会报错make版本太低,所以直接放弃centos,投入ubun ...

  2. JavaWeb--Cookie与Session

    前言 Java Web 其实就是一个技术的总和,把Web看成一个容器而已主要使用JavaEE技术来实现.在加上各种中间件. 整个javaWeb阶段的内容通过实际的案例贯穿学习, 所涉及到的技术知识点会 ...

  3. 【原创】Selenium获取请求头、响应头

    本文仅供学习交流使用,如侵立删! Selenium获取请求头.响应头 操作环境 win10 . mac Python3.9 selenium.seleniumwire selenium是没有办法直接获 ...

  4. 为MySQL MGR实现简单的负载均衡代理

    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 原创:万里数据库,花家舍 导读 在多写(多节点写入)数据库(例如MySQL MGR的multi-primary mode) ...

  5. 蔚来杯2022牛客暑期多校训练营6 ABGJM

    比赛链接 A 题解 知识点:数学,构造. 题目要求构造一个长为 \(m\) 的序列 \(c\) ,\(m\) 自选,使得 \(c\) 的无限循环序列 \(b\) 中任意连续 \(a_i\) 个数中都存 ...

  6. 用 Antlr 重构脚本解释器

    前言 在上一个版本实现的脚本解释器 GScript 中实现了基本的四则运算以及 AST 的生成. 当我准备再新增一个 % 取模的运算符时,会发现工作很繁琐而且几乎都是重复的:主要是两步: 需要在词法解 ...

  7. 10大python加速技巧

    简介 目前非常多的数据竞赛都是提交代码的竞赛,而且加入了时间的限制,这就对于我们python代码的加速非常重要.本篇文章我们介绍在Python中加速代码的一些技巧.可能不是很多,但在一些大的循环或者函 ...

  8. HMS Core Discovery第17期回顾|音随我动,秒变音色造型师

    HMS Core Discovery第17期直播<音随我动,秒变音色造型师>,已于8月25日圆满结束,本期直播我们邀请了HMS Core音频编辑服务的产品经理.技术专家以及创新娱乐类应用& ...

  9. ASP.NET Core 6框架揭秘实例演示[34]:缓存整个响应内容

    我们利用ASP.NET开发的大部分API都是为了对外提供资源,对于不易变化的资源内容,针对某个维度对其实施缓存可以很好地提供应用的性能.<内存缓存与分布式缓存的使用>介绍的两种缓存框架(本 ...

  10. .NET 7 SDK 对容器的内置支持

    大家好,我是等天黑. .NET 又双叒叕出新功能了, 就在前几天,.NET 团队发布博客,宣称在 .NET SDK 中内置了对 .NET 应用容器化的支持. 小试牛刀 在正式介绍它之前,先通过一个简单 ...