前言

在IIOT领域,面临着保存海量数据的挑战,具体到Asset层面,则要保存物理对象,逻辑对象,复杂的关系,并支持对象间的组合,分类,标签和高效查询。总结来说,可以归纳为如下几种需求:
 
  1. 灵活的建模风格:支持不同业务领域业务对象
  2. 支持自定义属性:可以是简单的字符串,也可以是对象
  3. 支持对象间关系:层次或图关系
  4. 支持对象间组合:如电机由线圈和转子组成
  5. 支持分类:对对象做宏观分类并保存公共属性
  6. 支持标签:方便用户查询
  7. 支持灵活和高性能查询:支持针对属性,针对关系,层次等查询。
  8. 操作历史:操作日志和审计
  9. 业务能力扩展:脚本

架构

Predix架构如下所示:
 
  • REST API layer
Client应用可以通过REST API服务获取asset数据。这些接口提供了JSON形式的接口,用户可以通过POST形式传递这些数据。为了使用这些API,应用程序发送HTTPS请求并解析响应。可以使用任何web端开发语言解析。
  • Representation layer
Representation Layer将数据由JSON转换为内部图形式表示,也负责完成相反的过程。
  • Query engine
Query engine允许开发者使用JSON AND Graph Expression(GEL)来获取Asset Data Store中保存的任意对象或对象属性的数据。
  • Audit History Service
提供API用来获取Asset Service库中REST请求的历史信息。
  • Script engine
使用户能够将定制的业务逻辑绑定到Asset Service的REST API上。
  • Cassandra graph database
Assert Service将数据保存于Apache Cassandra Nosql数据库中

数据模型

asset

Asset模型可以理解为物理设备在虚拟世界的映射,Asset不但包含设备本身,也包含该设备如何组织和关联的信息。

classification

对asset进行分类,并保存其公共信息。

custom modeling object

自定义的模型,用来进一步进行描述,如生产商等。
API Category Description
Assets 典型的,我们采用层次结构定义asset,由parent asset和一个或多个child asset组成。我们可以将asset与一个classification或任意数目的custom modeling object关联。Asset可以包含任意多个用户自定义属性(custom-defined attribute)。

一个asset也可独立存在于系统中,不与任何的其他建模元素关联。

Classifications

采用树状结构组织,并了一种对asset进行分组和跟踪公共属性的手段。一个classification可以指向多个asset。classification的任意层次上均可以指定attribute。

Custom modeling objects

定制模型对象(custom modeling object)是层次化的,我们可以使用它为asset提供更多的信息。例如,我们可以为asset location,manufactureer等创建单独的对象。一个location可以与多个asset关联,类似的,一个asset也可以关联多个location。

模型示例

Fleets Sample JSON

{
"uri":"/fleets/up-1",
"name":"Union Pacific Fleet 1",
"customer":"/customers/union-pacific"
},

Manufacturers Sample JSON

"uri":"/manufacturers/GE",
"name":"General Electric Transportation",
"year_founded":"1892",
"hqLatLng":{
        "lat":41.881138, 
        "lng":-87.640666}
}

Engines Sample Data

{
"uri":"/engines/v12-1",
"type":"7FDL",
"horsepower":"4400",
"stroke":"230",
"bore":"220",
"RPM":"2400",
"manufacturer":"/manufacturers/GE"
}

Locomotives Sample JSON

{
"uri":"/locomotives/1",
"type":"Diesel-electric",
"model":"ES44AC",
"serial_no":"001",
"emission_tier":"0+",
"fleet":"/fleets/up-1",
"manufacturer":"/manufacturers/GE",
"engine":"/engines/v12-1",
"installedOn":"01/12/2005",
"dateIso":"2005-12-01T13:15:31Z",
"hqLatLng":{
"lat":33.914605,
"lng":-117.253374
}
}
从上面的例子可以看出模型是如何组织的。

存储分析

Asset的存储要考虑两个部分,json-schema和json。json-schema是json的校验标准,任何对存储系统的修改都需要使用json-schema校验。更加抽象的思考,json-schema类似于面向对象的类,而json则是类的实现:对象。只是这种实例化是由RESTAPI触发的,且合法性由json-schema保证。
 
由于工业领域需要面对海量对象,海量关系及多种结构的数据对象(blob value,,picture, log)等,传统的SQL数据库必然无法满足这些需求,且对于JSON来说,最适合应用key-value数据库类型,当然该数据库需要提供良好的性能及可扩展性。
 
经过近些年的发展,cassandra与hbase在不同领域内的应用出现了分化,hbase纪玉hadoop,支持mapreduce,更加适合于大数据计算的场景;而cassandra除了在范围查询性能落后与hbase之外,在易用性,可扩展性,健壮性(无管理节点),以及在大多数的性能应用场景上对hbase存在优势,因此考虑使用cassandra作为asset的存储。
 
具体的,使用cassandra要满足如下的要求:
 
  • 良好的横向扩展性
  • 良好的可维护性
  • 高性能
  • 支持历史记录存储
  • 能够扩展关系存储及查询

可扩展性

Predix提供了Javascript语言支持更多的自定义应用。
 
JS支持是JDK自带的功能,而Predix将此功能应用在REST API上,能够在REST API的执行前后运行JS脚本,实现功能的扩展。其中REST API既可以是资源的CRUD API,也可以是自定义API。其执行逻辑为:开始--->(JS代码)--->REST API--->(JS代码)-->系统通知
 
也即JS代码可以选择在REST API执行前后执行,如果JS代码在REST API执行前,则可用于输入数据校验等,如果在REST API执行后,则可进行通知发送等应用。为了更加灵活的使用JS代码,JS代码中可以引用已经定义的工具方法(Predix提供),也可以调用其他REST API接口。
 
JS代码执行时工业云应用必备的部分,如SCADA系统和Thingwrox均提供了JS代码执行功能。但Thingwrox的JS执行依附于Thing本身(自定义方法)及订阅,而Predix则基于对已有REST API的封装(当然也支持自定义的REST API),总的来说Thingwrox实现的功能,predix也能实现。
 
例如:
        1. 调用系统方法(predix和thingwrox均提供了系统方法)
        2. 调用asset的属性(均可,thingwrox可以在脚本中通过this.引用)
        3. 调用asset的方法(thingwrox可以,predix不明)
        4. 调用其他asset的属性(predix通过restapi查询)
        5. 调用其他asset的方法(可以实现,只要是REST API形式暴露)
        6. 执行结果返回(predix可以通过消息队列返回数据)
        

关键技术

JSON-SCHEMA

 
用以描述JSON的数据结构并做验证,JSON-SCHEMA是静态JSON描述,本身不具有任何约束力,需要在实现中加以限制:如执行新增操作时必须验证SCHEMA。
 
CASSANDRA
CASSANDRA是一个key-value数据库,具有高性能,高可靠性,去中心化等特性,并支持GRAPH扩展。
 

GEL

如果数据只能存储而不能查询,那就没有任何意义。predix定义了GEL语言用于查询Asset数据,该查询语言是灵活的,支持分页,过滤,正则表达式及关系查询。Asset服务就是要存储所有的模型数据,因此不能针对具体需求做针对性的开发。
 
在Asset  Service中,专门存在查询引擎(Graph Expression Lanauge Query Engine)完成这一功能,这也是工业云平台开发中所必须的。
 

业界比对

这里主要与Thingwrox做比对,Thingworx更是一个物联网平台,而Predix是工业云平台,定位不同,决定了这两个平台在设计上的取舍不同。
 
从建模进行比较,Thingworx弱化了多租户概念,并且基于对类-对象的抽象,给出了Thing-ThingTemplate-ThingShape的模型,能够对每一物理/逻辑实体进行建模。如一个泵,或者是以datasource;而Predix更偏重与处理工业领域的物理实体映射,并不试图建立一个包含一切的建模环境,这种取舍,在工业领域是可以理解的。

优秀实践

1. 使用URI定义资源,并天然具有REST API的证删改查能力
2. 使用JSON-SCHEMA定义数据结构,来代替表,并提供灵活扩展能力(虽然对已有数据无法进行处理,需要用户自己实现)
3. 提供了查询语言,避免陷入无穷无尽的业务开发中去
4. 提供了JS支持,给用户以最大的扩展性
5. 微服务扩展灵活支持多租户

Predix Asset Service深度分析的更多相关文章

  1. AndroidService 深度分析(2)

    AndroidService 深度分析(2) 上一篇文章我们Service的生命周期进行了測试及总结. 这篇文章我们介绍下绑定执行的Service的实现. 绑定执行的Service可能是仅为本应用提供 ...

  2. const与readonly深度分析(.NET)

    前言 很多.NET的初学者对const和readonly的使用很模糊,本文就const和readonly做一下深度分析,包括: 1. const数据类型的优势 2. const数据类型的劣势 3. r ...

  3. 转:[gevent源码分析] 深度分析gevent运行流程

    [gevent源码分析] 深度分析gevent运行流程 http://blog.csdn.net/yueguanghaidao/article/details/24281751 一直对gevent运行 ...

  4. 深度分析 Java 的枚举类型:枚举的线程安全性及序列化问题(转)

    写在前面: Java SE5 提供了一种新的类型 Java的枚举类型,关键字 enum 可以将一组具名的值的有限集合创建为一种新的类型,而这些具名的值可以作为常规的程序组件使用,这是一种非常有用的功能 ...

  5. 深度分析如何在Hadoop中控制Map的数量

    深度分析如何在Hadoop中控制Map的数量 guibin.beijing@gmail.com 很多文档中描述,Mapper的数量在默认情况下不可直接控制干预,因为Mapper的数量由输入的大小和个数 ...

  6. MapReduce深度分析(二)

    MapReduce深度分析(二) 五.JobTracker分析 JobTracker是hadoop的重要的后台守护进程之一,主要的功能是管理任务调度.管理TaskTracker.监控作业执行.运行作业 ...

  7. MapReduce深度分析(一)

    MapReduce深度分析(一) 一.数据流向分析 图为MapReduce数据流向示意图 步骤1.输入文件从HDFS流向到Mapper节点.在一般情况下,存储数据的节点就是Mapper运行的节点,不需 ...

  8. 【JVM】深度分析Java的ClassLoader机制(源码级别)

    原文:深度分析Java的ClassLoader机制(源码级别) 为了更好的理解类的加载机制,我们来深入研究一下ClassLoader和他的loadClass()方法. 源码分析 public abst ...

  9. 深度分析Java的枚举类型—-枚举的线程安全性及序列化问题

    原文:深度分析Java的枚举类型--枚举的线程安全性及序列化问题 枚举是如何保证线程安全的 要想看源码,首先得有一个类吧,那么枚举类型到底是什么类呢?是enum吗?答案很明显不是,enum就和clas ...

随机推荐

  1. 初学grunt压缩

    初学grunt 压缩,做个记录.备忘. [JS压缩] 先比较yui compressor 与 uglify  代码压缩, yui compressor,使用起来很简单.需要jdk. https://g ...

  2. 基于MATLAB的数字基带信号的各种码型的产生

    单极性非归零码 单极性非归零码使用电平1来表示二元信息中的“1”,用电平0来表示二元信息中的“0”,电平在整个码元的时间里不变单极性非归零码的优点是实现简单,但由于含有直流分量,对在带限信道中的传输不 ...

  3. Java排序算法之希尔(Shell)排序

    基本思想: 希尔排序就是对直接插入排序的一个优化.现在有一个array,希尔排序就是设定一个增量incrementNum(0<incrementNum<array.length).先从ar ...

  4. js日期转化(计算一周的日期)

    之前做项目的时候遇到过一个日期转化的问题,一个日期控件和近一天,近七天和近一月的的联动效果.发现自己不会,后来就百度了一下解决了这个问题. 现在抽空又写了一个时间转化的案例(计算一周的日期),因为之前 ...

  5. .NET的JSON格式数据的三种转换方式

    说明: 1..Net进行JSON格式的数据传递的时候,势必用到序列化和反序列化对象,总共有三种方式可是在.NET中实现序列化和反序列化的需求. 2.操作JSON的速度是:Json.net > M ...

  6. 随机Prim法创建随机迷宫(C#实现)

    因为这两天想参加一个比赛,所以就在上网找素材,刚好看到了迷宫生成,就决定拿这个开刀了. 参考的原文地址为(来源页面) 源地址中是使用AS实现的,没学过AS,所以直接不会运行,于是就自己根据原文的概念进 ...

  7. poj3264线段数求最大最小值

    链接:https://vjudge.net/contest/66989#problem/G 完完全全的水题,还是被坑了,一个return忘了写,de了半天bug!! #include<iostr ...

  8. java线程(二)

    线程范围变量 我们知道线程在cpu上的使用权并不是长时间的,因为计算机的cpu只有一个,而在计算上运行的进程有很多,线程就更不用说了,所以cpu只能通过调度来上多个线程轮流占用cpu资源运行,且为了保 ...

  9. Java中File

    1.什么是流? Java中的流是个抽象的概念,当程序需要从某个数据源读入数据的时候,就会开启一个数据流,数据源可以是文件.内存或网络等等.2.使用File类操作文件或目录属性 public class ...

  10. 转:Linux中文显示乱码?如何设置centos显示中文

    怎么设置Linux系统中文语言,这是很多小伙伴在开始使用Linux的时候,都会遇到一个问题,就是终端输入命令回显的时候中文显示乱码.出现这个情况一般是由于没有安装中文语言包,或者设置的默认语言有问题导 ...