Akka源码分析-Persistence Query

　　Akka Persistence Query是对akka持久化的一个补充，它提供了统一的、异步的流查询接口。今天我们就来研究下这个Persistence Query。

　　前面我们已经分析过Akka Persistence，它是用来持久化actor状态并在适当时机恢复actor的，简单来说它是用来写入的。那么Persistence Query与Persistence相对应，是用来读取数据的，一般用在读写分离的read side。

　　Persistence Query主要的目标是设计一套松散的API，这样各个实现才能充分暴露他们各自的特点或性能，而不被API所约束。每个读取器都必须显示的说明他们支持的查询类型。

　　Akka Persistence Query并不提供ReadJournals的具体实现。它只是定义了一些预定义的、满足大部分查询场景的查询类型，且可能被绝大多数journal实现的，当然并不要求一定实现。

　　ReadJournal是提交查询必须首要创建的一个实例，所有的读取器（Read journal）都以社区插件的形式实现，官方只提供框架。每个特定的实现都对应特定的存储。

// obtain read journal by plugin id

val readJournal =

  PersistenceQuery(system).readJournalFor[MyScaladslReadJournal](

    "akka.persistence.query.my-read-journal")

// issue query to journal

val source: Source[EventEnvelope, NotUsed] =

  readJournal.eventsByPersistenceId("user-1337", 0, Long.MaxValue)

// materialize stream, consuming events

implicit val mat = ActorMaterializer()

source.runForeach { event ⇒ println("Event: " + event) }

　　官方demo的第一行代码就是通过配置创建了一个readJournal实例。很显然它是通过PersistenceQuery这个扩展的readJournalFor方法来创建的，第二行代码显示，它至少支持eventsByPersistenceId这个预定义的查询。

　　我们知道Akka persistence query提供了一些预定义查询接口，和journal实现的框架。那预定义的查询接口是否通用就很重要了。预定义的接口有：

PersistenceIdsQuery
CurrentPersistenceIdsQuery
EventsByPersistenceIdQuery
CurrentEventsByPersistenceIdQuery
EventsByTag
CurrentEventsByTag

　　其实demo中的readJournalFor的第一个参数就是一个persistenceId，它是用来订阅系统中所有持久化数据的一个流的。简单来说，我们可以理解为RDBMS中的一个表名。PersistenceIdsQuery就是用来查询当前系统有多少个可用的“表”的。PersistenceIdsQuery和CurrentPersistenceIdsQuery的区别就是，后者只是获取当前persistenceId的一个快照，而前者是实时的。

　　EventsByPersistenceIdQuery可以理解为通过表名查询数据，查询结果也是一个实时的流。CurrentEventsByPersistenceIdQuery是全量查询一个快照。

　　EventsByTag可以理解为按照数据的标签查询，它忽略了数据关联的persistenceId。其实这一点不太好实现，它跨越了“表”查询数据，很多存储系统都是以表做物理数据的隔离的，如果跨表有可能意味着跨物理存储，而且对性能也会有影响。另外一个很重要的问题就是，通过tag查询数据，往往不能保证数据的顺序。CurrentEventsByTag也是查询当前数据的快照，其实就是全量查询。

　　查询的具体化值。我们还可以给journal传递额外的信息，比如过滤条件、是否排序等等。这是通过byTagsWithMeta方法实现的。下面我们去源码看下。

class PersistenceQuery(system: ExtendedActorSystem)

  extends PersistencePlugin[scaladsl.ReadJournal, javadsl.ReadJournal, ReadJournalProvider](system)(ClassTag(classOf[ReadJournalProvider]), PersistenceQuery.pluginProvider)

  with Extension

　　上面是PersistenceQuery这个扩展的定义，继承了PersistencePlugin，并提供了readJournalFor的方法。

  /**

   * Scala API: Returns the [[akka.persistence.query.scaladsl.ReadJournal]] specified by the given

   * read journal configuration entry.

   *

   * The provided readJournalPluginConfig will be used to configure the journal plugin instead of the actor system

   * config.

   */

  final def readJournalFor[T <: scaladsl.ReadJournal](readJournalPluginId: String, readJournalPluginConfig: Config): T =

    pluginFor(readJournalPluginId, readJournalPluginConfig).scaladslPlugin.asInstanceOf[T]

　　其实就是通过readJournalPluginId创建了一个ReadJournal实例，这个函数还是去调用了pluginFor方法。

  @tailrec

  final protected def pluginFor(pluginId: String, readJournalPluginConfig: Config): PluginHolder[ScalaDsl, JavaDsl] = {

    val configPath = pluginId

    val extensionIdMap = plugins.get

    extensionIdMap.get(configPath) match {

      case Some(extensionId) ⇒

        extensionId(system)

      case None ⇒

        val extensionId = new ExtensionId[PluginHolder[ScalaDsl, JavaDsl]] {

          override def createExtension(system: ExtendedActorSystem): PluginHolder[ScalaDsl, JavaDsl] = {

            val provider = createPlugin(configPath, readJournalPluginConfig)

            PluginHolder(

              ev.scalaDsl(provider),

              ev.javaDsl(provider)

            )

          }

        }

        plugins.compareAndSet(extensionIdMap, extensionIdMap.updated(configPath, extensionId))

        pluginFor(pluginId, readJournalPluginConfig)

    }

  }

　　pluginFor其实也比较简单，它就是返回了PluginHolder，而PluginHolder继承了Extension只不过有两个类型参数：ScalaDsl、JavaDsl。如果没有找到就创建默认的，默认应该就是leveldb。其实可以看到PersistenceQuery只是提供了创建ReadJournal的接口，以及两个类型参数，并没有做过多的限制。那ReadJournal这个trait又是什么样的呢？

/**

 * API for reading persistent events and information derived

 * from stored persistent events.

 *

 * The purpose of the API is not to enforce compatibility between different

 * journal implementations, because the technical capabilities may be very different.

 * The interface is very open so that different journals may implement specific queries.

 *

 * There are a few pre-defined queries that a query implementation may implement,

 * such as [[EventsByPersistenceIdQuery]], [[PersistenceIdsQuery]] and [[EventsByTagQuery]]

 * Implementation of these queries are optional and query (journal) plugins may define

 * their own specialized queries by implementing other methods.

 *

 * Usage:

 * {{{

 * val journal = PersistenceQuery(system).readJournalFor[SomeCoolReadJournal](queryPluginConfigPath)

 * val events = journal.query(EventsByTag("mytag", 0L))

 * }}}

 *

 * For Java API see [[akka.persistence.query.javadsl.ReadJournal]].

 */

trait ReadJournal

　　其实可以看到ReadJournal也没有任何默认的方法，这样来看，即使继承了这个接口的read journal不提供任何查询方法，或提供不符合预定义接口的方法也都是完全可以的。

/**

 * A plugin may optionally support this query by implementing this trait.

 */

trait PersistenceIdsQuery extends ReadJournal {

  /**

   * Query all `PersistentActor` identifiers, i.e. as defined by the

   * `persistenceId` of the `PersistentActor`.

   *

   * The stream is not completed when it reaches the end of the currently used `persistenceIds`,

   * but it continues to push new `persistenceIds` when new persistent actors are created.

   * Corresponding query that is completed when it reaches the end of the currently

   * currently used `persistenceIds` is provided by [[CurrentPersistenceIdsQuery#currentPersistenceIds]].

   */

  def persistenceIds(): Source[String, NotUsed]

}

　　我们来看看预定义的查询接口PersistenceIdsQuery，其实它就只是定义了一个方法，这个方法返回一个Source。那如果继承ReadJournal的自定义读取器不继承这个接口可以吗？完全可以！

/**

 * Scala API [[akka.persistence.query.scaladsl.ReadJournal]] implementation for LevelDB.

 *

 * It is retrieved with:

 * {{{

 * val queries = PersistenceQuery(system).readJournalFor[LeveldbReadJournal](LeveldbReadJournal.Identifier)

 * }}}

 *

 * Corresponding Java API is in [[akka.persistence.query.journal.leveldb.javadsl.LeveldbReadJournal]].

 *

 * Configuration settings can be defined in the configuration section with the

 * absolute path corresponding to the identifier, which is `"akka.persistence.query.journal.leveldb"`

 * for the default [[LeveldbReadJournal#Identifier]]. See `reference.conf`.

 */

class LeveldbReadJournal(system: ExtendedActorSystem, config: Config) extends ReadJournal

  with PersistenceIdsQuery with CurrentPersistenceIdsQuery

  with EventsByPersistenceIdQuery with CurrentEventsByPersistenceIdQuery

  with EventsByTagQuery with CurrentEventsByTagQuery

　　这是默认提供的LeveldbReadJournal的实现，其实从这个接口来看它具有PersistenceIdsQuery、CurrentPersistenceIdsQuery、EventsByPersistenceIdQuery、CurrentEventsByPersistenceIdQuery、EventsByTagQuery、CurrentEventsByTagQuery的功能。

　　其实吧，从这个具体实现来看，Akka Persistence Query只是提供了一个扩展，规定了ReadJournal实现的机制，对其具体的功能并没有任何强制的要求，这样就意味着，只能从文档上规范大家，要实现ReadJournal特质的一系列预定义接口。个人觉得吧，只要不是技术上的强制措施，在实施的时候都会有困难，既然你都不做严格限定了，那还不是百花齐放百家争鸣、千奇百怪的了。还不如直接定死了要实现的几个接口，如果不支持对应的操作直接抛异常不就完了。可能akka想让大家灵活点吧，鬼知道呢。

　　其实吧，Akka Persistence Query就算讲完了。akka好像啥也没做，只是文档定义了几个概念和接口，具体有没有实现并没有做强制要求。既然这样，大家还不如直接自己玩。实现自己的查询接口与实现，供大家参考使用呢。

Persistence Query

Akka源码分析-Persistence Query的更多相关文章

Akka源码分析-Persistence
在学习akka过程中,我们了解了它的监督机制,会发现actor非常可靠,可以自动的恢复.但akka框架只会简单的创建新的actor,然后调用对应的生命周期函数,如果actor有状态需要回复,我们需要h ...
Akka源码分析-Akka Typed
对不起,akka typed 我是不准备进行源码分析的,首先这个库的API还没有release,所以会may change,也就意味着其概念和设计包括API都会修改,基本就没有再深入分析源码的意义了. ...
Akka源码分析-Akka-Streams-概念入门
今天我们来讲解akka-streams,这应该算akka框架下实现的一个很高级的工具.之前在学习akka streams的时候,我是觉得云里雾里的,感觉非常复杂,而且又难学,不过随着对akka源码的深 ...
Akka源码分析-Cluster-Metrics
一个应用软件维护的后期一定是要做监控,akka也不例外,它提供了集群模式下的度量扩展插件. 其实如果读者读过前面的系列文章的话,应该是能够自己写一个这样的监控工具的.简单来说就是创建一个actor,它 ...
Akka源码分析-Cluster-Distributed Publish Subscribe in Cluster
在ClusterClient源码分析中,我们知道,他是依托于“Distributed Publish Subscribe in Cluster”来实现消息的转发的,那本文就来分析一下Pub/Sub是如 ...
Akka源码分析-Cluster-Singleton
akka Cluster基本实现原理已经分析过,其实它就是在remote基础上添加了gossip协议,同步各个节点信息,使集群内各节点能够识别.在Cluster中可能会有一个特殊的节点,叫做单例节点. ...
Akka源码分析-local-DeathWatch
生命周期监控,也就是死亡监控,是akka编程中常用的机制.比如我们有了某个actor的ActorRef之后,希望在该actor死亡之后收到响应的消息,此时我们就可以使用watch函数达到这一目的. c ...
Akka源码分析-Cluster-ActorSystem
前面几篇博客,我们依次介绍了local和remote的一些内容,其实再分析cluster就会简单很多,后面关于cluster的源码分析,能够省略的地方,就不再贴源码而是一句话带过了,如果有不理解的地方 ...
第十篇：Spark SQL 源码分析之 In-Memory Columnar Storage源码分析之 query
/** Spark SQL源码分析系列文章*/ 前面讲到了Spark SQL In-Memory Columnar Storage的存储结构是基于列存储的. 那么基于以上存储结构,我们查询cache在 ...

随机推荐

Milking Time---poj3616
Description Bessie is such a hard-working cow. In fact, she is so focused on maximizing her producti ...
LinkedList总结
1,LinkedList也是继承了List的接口所以在LinkedList中存储的也是有序的,不唯一的数据它采用的是链表式储存,所以比较适合用来执行插入,删除等功能 2,LinkedList特有的 ...
why在重写equals时还必须重写hashcode方法
首先我们先来看下String类的源码:可以发现String是重写了Object类的equals方法的,并且也重写了hashcode方法 public boolean equals(Object anO ...
java 返回json数据
Student st1 = new Student(1, "dg", 18, new Date()); Student st2 = new Student(2 ...
CentOS系统如何设置服务开机自动运行
centos安装好apache,mysql等服务器程序后,并没有设置成开机自动启动的,为避免重启后还要手动开启web等服务器,还是做下设置好,其实设置很简单,用chkconfig命令就行了.例如要开机 ...
怎样使用SSH连接OpenStack上的云主机
转载请注明出处.否则将追究法律责任http://blog.csdn.net/xingjiarong/article/details/47021815 在上一篇博客中我介绍了怎样在OpenStack中创 ...
工作总结使用html模板发邮件前面空一大块
HTML邮件的本质其实是发送了一个html页面.邮件的空白必然是页面的空白,所以你要找到你发送邮件的html模板所在,然后去掉空白即可,如果这是一个公共文件,需要注意你往往用的只是你的部分,很大程度还 ...
ZOJ 3228 Searching the String （AC自己主动机）
题目链接:Searching the String 解析:给一个长串.给n个不同种类的短串.问分别在能重叠下或者不能重叠下短串在长串中出现的次数. 能重叠的已经是最简单的AC自己主动机模板题了. 不能 ...
UVA 10288 - Coupons(概率递推)
UVA 10288 - Coupons option=com_onlinejudge&Itemid=8&page=show_problem&category=482&p ...
android findVIewById()在线生成工具
今天突然发现一个好工具,能够依据你输入的XML布局文件,自己主动生成findViewById的代码.还支持android annotation的注解方式.真是太棒了.由于我正是使用androidann ...

Akka源码分析-Persistence Query

Akka源码分析-Persistence Query的更多相关文章

随机推荐

热门专题