集群中的分布式发布订阅

如何向一个不知道在哪个节点上运行的actor发送消息呢?

如何向集群中的所有actor发送感兴趣的主题的消息?

这种模式提供了一个中介actor,akka.cluster.pubsub.DistributedPubSubMediator,它管理actor引用的注册,复制所有集群节点或者特定角色节点的对等actor的条目。

DistributedPubSubMediator actor应该在所有的节点上或者特定角色的节点上启动。中介可以由DistributedPubSub扩展启动或者作为普通的actor启动。

注册最终是一致的,即变化不会被其它的节点立即看到,但是通常它们会在几秒之后被完全复制到所有的节点上。只在自己的注册部分执行变化,这些变化被版本化了。变化的增量用gossip协议以可伸缩的方式传播到其它的节点。

WeaklyUp状态的集群成员,如果这个特性使能了,将会参与到分布式发布订阅,即WeaklyUp状态节点的订阅者会收到发布的消息,如果发布者和订阅者在同一个网络分区。

你可以通过任意节点上的中介者向任何其它节点注册的actor发送消息。

有两种不同的消息投递模式,分别在发布和发送章节进行解释。

发布Publish

这是真正的发布订阅模式。这种模式的一种典型用法就是即时消息应用中的聊天室。

Actor注册到被命名的主题。这将使能每一个节点上的多个订阅者。消息将会投递到这个主题的所有订阅者。

为了提高效率,消息只会通过这个wire向每一个节点发送一次(有匹配的主题)然后就被投递到本地主题的所有订阅者。

你用DistributedPubSubMediator.Subscribe方法将actor注册到本地中介者。成功的订阅和取消订阅由DistributedPubSubMediator.SubscribeAck和 DistributedPubSubMediator.UnsubscribeAck应答确认。这个确认消息意味着订阅已经注册了,但是它仍然需要花费一些时间复制到其它的节点上。

你通过向本地的中介者发送DistributedPubSubMediator.Publish消息来发布消息。

当actor终止时,它们会自动从注册表移除,或者你可以明确的使用DistributedPubSubMediator.Unsubscribe移除。

订阅actor的一个例子:

  1. import akka.actor.ActorRef;
  2. import akka.actor.UntypedActor;
  3. import akka.cluster.pubsub.DistributedPubSub;
  4. import akka.cluster.pubsub.DistributedPubSubMediator;
  5. import akka.event.Logging;
  6. import akka.event.LoggingAdapter;
  7. publicclass Subscriber extends UntypedActor {
  8. LoggingAdapter log = Logging.getLogger(getContext().system(), this);
  9. public Subscriber() {
  10. ActorRef mediator = DistributedPubSub.get(getContext().system()).mediator();
  11. // subscribe to the topic named "content"
  12. mediator.tell(new DistributedPubSubMediator.Subscribe("content", getSelf()), getSelf());
  13. }
  14. @Override
  15. publicvoid onReceive(Object msg) {
  16. if (msginstanceof String)
  17. log.info("Got: {}", msg);
  18. elseif (msginstanceof DistributedPubSubMediator.SubscribeAck)
  19. log.info("subscribing");
  20. else
  21. unhandled(msg);
  22. }
  23. }

订阅者可以再集群的多个节点上启动,所有的订阅者都会收到发布到"content"主题的消息:

system.actorOf(Props.create(Subscriber.class), "subscriber1");

//another node

system.actorOf(Props.create(Subscriber.class), "subscriber2");

system.actorOf(Props.create(Subscriber.class), "subscriber3");

一个发布消息到"content"主题的简单actor:

  1. import akka.actor.ActorRef;
  2. import akka.actor.UntypedActor;
  3. import akka.cluster.pubsub.DistributedPubSub;
  4. import akka.cluster.pubsub.DistributedPubSubMediator;
  5. publicclass Publisher extends UntypedActor {
  6. // activate the extension
  7. ActorRef mediator = DistributedPubSub.get(getContext().system()).mediator();
  8. @Override
  9. publicvoid onReceive(Object msg) {
  10. if (msginstanceof String) {
  11. String in = (String) msg;
  12. String out = in.toUpperCase();
  13. mediator.tell(new DistributedPubSubMediator.Publish("content", out), getSelf());
  14. } else {
  15. unhandled(msg);
  16. }
  17. }
  18. }

它可以从集群中的任何地方发布消息到这个主题:

//somewhere else

ActorRef publisher = system.actorOf(Props.create(Publisher.class), "publisher");

// after a while the subscriptions are replicated

publisher.tell("hello", null);

主题分组

具有groupid的Actor也订阅被命名的主题。如果用group Id订阅,那么每一个发布到该主题(sendOneMessageToEachGroup标记为true)的消息都通过RoutingLogic(默认是随机的)投递到每一个订阅组的一个actor。

如果所有的订阅actor都具有相同的group id,那么它工作起来就像Send(发送),每一个消息只投递到一个订阅者。

如果所有的订阅actor具有不同的group名字,那么它工作起来就跟正常的Publish(发布)一样了,每一个消息都广播到所有的订阅者。

注意:如果使用group id,那么它将是主题标识符的一部分。用sendOneMessageToEachGroup=false发送的消息将不会投递到以group id订阅的订阅者。用sendOneMessageToEachGroup=true发布的消息不会投递到没有用group id订阅的订阅者。

发送Send

这是点到点模式,每一个消息都投递到一个目的地,但是你仍然不知道目的地位于哪儿。这种模式的典型用法是即时消息应用中的私有聊天。它可以被用于发布任务到注册的worker,就像感知集群的router那样,routee会动态注册自己。

消息会被投递到一个匹配路径的接收者,如果注册表中存在这样的接收者。如果多个条目匹配这个路径,因为它注册到了多个节点上,那么消息会通过提供的RoutingLogic (默认是随机的)投递到目的地。消息的发送者可以指定偏好本地近亲,即消息发送到一个相同的本地actor系统中的中介者actor,如果他存在的话,否则就会路由到其它匹配的条目。

你会用DistributedPubSubMediator.Put 注册actor到本地的中介者。Put中的ActorRef必须与中介者属于相同的本地actor系统。没有地址信息的路径就是你发送消息的关键字。在每一个节点上,只有一个给定路径的actor,因为一个本地actor系统中的路径是唯一的。

你用DistributedPubSubMediator.Send消息发送消息到具有目的actor路径(没有地址信息)的本地中介者。

当actor终止时,它们自动从注册表中移除,或者你可以明确地使用DistributedPubSubMediator.Remove移除。

目的actor的示例:

  1. import akka.actor.ActorRef;
  2. import akka.actor.UntypedActor;
  3. import akka.cluster.pubsub.DistributedPubSub;
  4. import akka.cluster.pubsub.DistributedPubSubMediator;
  5. import akka.event.Logging;
  6. import akka.event.LoggingAdapter;
  7. publicclass Destination extends UntypedActor {
  8. LoggingAdapter log = Logging.getLogger(getContext().system(), this);
  9. public Destination() {
  10. ActorRef mediator = DistributedPubSub.get(getContext().system()).mediator();
  11. // register to the path
  12. mediator.tell(new DistributedPubSubMediator.Put(getSelf()), getSelf());
  13. }
  14. @Override
  15. publicvoid onReceive(Object msg) {
  16. if (msginstanceof String)
  17. log.info("Got: {}", msg);
  18. elseif (msginstanceof DistributedPubSubMediator.SubscribeAck)
  19. log.info("subscribing");
  20. else
  21. unhandled(msg);
  22. }
  23. }

Subscriber actors can be started on several nodes in the cluster, and all will receive messages published to the "content" topic.

system.actorOf(Props.create(Destination.class), "destination");

//another node

system.actorOf(Props.create(Destination.class), "destination");

向"content"主题发送消息的简单actor:

  1. import akka.actor.ActorRef;
  2. import akka.actor.UntypedActor;
  3. import akka.cluster.pubsub.DistributedPubSub;
  4. import akka.cluster.pubsub.DistributedPubSubMediator;
  5. publicclass Sender extends UntypedActor {
  6. // activate the extension
  7. ActorRef mediator = DistributedPubSub.get(getContext().system()).mediator();
  8. @Override
  9. publicvoid onReceive(Object msg) {
  10. if (msginstanceof String) {
  11. String in = (String) msg;
  12. String out = in.toUpperCase();
  13. booleanlocalAffinity = true;
  14. mediator.tell(new DistributedPubSubMediator.Send("/user/destination",out,
  15. localAffinity), getSelf());
  16. } else {
  17. unhandled(msg);
  18. }
  19. }
  20. }

可以从集群的任何地方向主题发布消息:

//somewhere else

ActorRef sender = system.actorOf(Props.create(Publisher.class), "sender");

// after a while the destinations are replicated

sender.tell("hello", null);

向用Put注册的actor广播消息也是可能的。向本地的中介者发送 DistributedPubSubMediator.SendToAll消息,包装消息会被投递到匹配路径的所有接收者。具有相同path的actor,没有地址信息,可以在不同的节点上注册。每一个节点只能有一个这样的actor,因为一个本地actor系统的路径是唯一的。

这种模式的典型用法是广播消息给相同路径的接收者,例如不同节点上的3个actor执行相同的动作来实现冗余。你可以指定一个属性(allButSelf)来决定是否消息应该发送到自己节点上的匹配路径。

Distributed发布订阅扩展

在上面的例子中,中介者是通过akka.cluster.pubsub.DistributedPubSub扩展启动和访问的。在大多数场景下,这都是很方便的,也是极好的,但是最好要知道中介者actor也可以作为普通的actor启动,你可以具有多个不同中介者actor,这能够将大量的actor/主题分到不同的中介者。例如,你可能想要使用不同的集群角色的中介者。

DistributedPubSub扩展可以用如下的属性进行配置:

# Settings for the DistributedPubSub extension

akka.cluster.pub-sub {

# Actor name of the mediator actor, /system/distributedPubSubMediator

name = distributedPubSubMediator

# Start the mediator on members tagged with this role.

# All members are used if undefined or empty.

role = ""

# The routing logic to use for 'Send'

# Possible values: random, round-robin, broadcast

routing-logic = random

# How often the DistributedPubSubMediator should send out gossip information

gossip-interval = 1s

# Removed entries are pruned after this duration

removed-time-to-live = 120s

# Maximum number of elements to transfer in one message when synchronizing the registries.

# Next chunk will be transferred in next round of gossip.

max-delta-elements = 3000

# The id of the dispatcher to use for DistributedPubSubMediator actors.

# If not specified default dispatcher is used.

# If specified you need to define the settings of the actual dispatcher.

use-dispatcher = ""

}

推荐当actor系统启动时加载这个扩展,这需要定义akka.extensions配置属性。否则它在第一次使用时激活,然后过一会儿才能使用。

akka.extensions = ["akka.cluster.pubsub.DistributedPubSub"]

投递保证

正如Akka的消息投递可靠性所言,在分布式发布订阅模式中的消息投递保证是最多一次投递at-most-once delivery。换句话说,消息可能会丢失。

如果你正在寻找at-least-once投递保证,我们推荐Kafka Akka Streams integration

依赖

要使用分布式发布订阅,你得工程必须添加如下的依赖:

sbt:

"com.typesafe.akka" %% "akka-cluster-tools" % "2.4.16"

maven:

  1. <dependency>
  2. <groupId>com.typesafe.akka</groupId>
  3. <artifactId>akka-cluster-tools_2.11</artifactId>
  4. <version>2.4.16</version>
  5. </dependency>

AKKA集群中的分布式发布订阅的更多相关文章

  1. AKKA 集群中的发布与订阅Distributed Publish Subscribe in Cluster

    Distributed Publish Subscribe in Cluster 基本定义 在单机环境下订阅与发布是很常用的,然而在集群环境是比较麻烦和不好实现的: AKKA已经提供了相应的实现,集群 ...

  2. Akka系列(十):Akka集群之Akka Cluster

    前言........... 上一篇文章我们讲了Akka Remote,理解了Akka中的远程通信,其实Akka Cluster可以看成Akka Remote的扩展,由原来的两点变成由多点组成的通信网络 ...

  3. 如果Apache Spark集群中没有分布式系统,则会?

    若当连接到Spark的master之后,若集群中没有分布式文件系统,Spark会在集群中每一台机器上加载数据,所以要确保Spark集群中每个节点上都有完整数据. 通常可以选择把数据放到HDFS.S3或 ...

  4. 一脸懵逼学习KafKa集群的安装搭建--(一种高吞吐量的分布式发布订阅消息系统)

    kafka的前言知识: :Kafka是什么? 在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算.kafka是一个生产-消费模型. Producer:生产者,只负责数 ...

  5. Hadoop学习笔记—13.分布式集群中节点的动态添加与下架

    开篇:在本笔记系列的第一篇中,我们介绍了如何搭建伪分布与分布模式的Hadoop集群.现在,我们来了解一下在一个Hadoop分布式集群中,如何动态(不关机且正在运行的情况下)地添加一个Hadoop节点与 ...

  6. redis/分布式文件存储系统/数据库 存储session,解决负载均衡集群中session不一致问题

    先来说下session和cookie的异同 session和cookie不仅仅是一个存放在服务器端,一个存放在客户端那么笼统 session虽然存放在服务器端,但是也需要和客户端相互匹配,试想一个浏览 ...

  7. 分布式集群中,设定时间同步服务器,以及ntpd与ntpdate的区别

    什么时候配置时间同步? 当分布式集群配置好了以后,马上配置的是SSH无密钥配置,然后就是配置时间同步. 时间同步在集群中特别重要. 一:时间同步 1.时间同步 集群中必须有一个统一的时间 如果是内网, ...

  8. 030 分布式集群中,设定时间同步服务器,以及ntpd与ntpdate的区别

    什么时候配置时间同步? 当分布式集群配置好了以后,马上配置的是SSH无密钥配置,然后就是配置时间同步. 时间同步在集群中特别重要. 一:时间同步 1.时间同步 集群中必须有一个统一的时间 如果是内网, ...

  9. Hadoop学习之路(十二)分布式集群中HDFS系统的各种角色

    NameNode 学习目标 理解 namenode 的工作机制尤其是元数据管理机制,以增强对 HDFS 工作原理的 理解,及培养 hadoop 集群运营中“性能调优”.“namenode”故障问题的分 ...

随机推荐

  1. C++ 常用函数方法

    /* * 拆分字符串 * 参数: * strData 字符串 * split 分隔符 * 返回: * 返回动态数组std::vector<std::string> ,记得要delete 内 ...

  2. Linux之 AWK SED

    AWK系列#awk 中 NF表示取最后一列 NR表示取第几行 NR==3 表示取第三行[root@nodchen-db01-test ~]# free -m | awk 'NR==3 {print $ ...

  3. Fix-Dell iDRAC 7 error: RAC0218: The maximum number of user sessions is reached

    Hi Everyone, We came across the following error while performing some preventative maintenance check ...

  4. PHP PDO prepare()、execute()和bindParam()方法详解

    每次将查询发送给MySQL服务器时,都必须解析该查询的语法,确保结构正确并能够执行.这是这个过程中必要的步骤,但也确实带来了一些开销.做一次是必要的,但如果反复地执行相同的查询,批量插入多行并只改变列 ...

  5. Web 下载图片为空

    问题描述: 文件下载功能是web开发中经常使用到的功能,使用HttpServletResponse对象就可以实现文件的下载.但是下载任务正常进行,下载下来的图片却是空 问题代码: //从服务器下载一张 ...

  6. Hive基础之Hive表常用操作

    本案例使用的数据均来源于Oracle自带的emp和dept表 创建表 语法: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name ...

  7. hive-hbase-handler方式导入hive表数据到hbase表中

    Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive-hbase-handler.jar工具类 : hive-hbase-handler.jar在 ...

  8. Spark standalone运行模式

    Spark Standalone 部署配置 Standalone架构 手工启动一个Spark集群 https://spark.apache.org/docs/latest/spark-standalo ...

  9. IO模式调查利器blkiomon介绍

    本文链接地址: IO模式调查利器blkiomon介绍 blkiomon 是blktrace工具包带的一个方便用户了解IO情况的工具, 由于blktrace太专业,需要了解的IO协议栈的东西太多,blk ...

  10. HTML5 Canvas ( 图形变换, 升级版的星空 ) translate, rotate, scale

    <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...