云栖深度干货 | 打造“云边一体化”，时序时空数据库TSDB技术原理深度解密

本文选自云栖大会下一代云数据库分析专场讲师自修的演讲——《TSDB云边一体化时序时空数据库技术揭秘》自修 —— 阿里云智能数据库产品事业部高级专家

认识TSDB

第一代时序时空数据处理工具虽然通用关系数据库可以存储时序数据，但是由于缺乏针对时间的特殊优化，比如按时间间隔存储和检索数据等等，因此在处理这些数据时效率相对不高。第一代时序数据典型来源于监控领域，直接基于平板文件的简单存储工具成为这类数据的首先存储方式。以RRDTool，Wishper为代表，通常这类系统处理的数据模型比较单一，单机容量受限，并且内嵌于监控告警方案。

第二代面向时序时空领域的数据库伴随着大数据和Hadoop的发展，时序数据量开始迅速增长，系统业务对于处理时序数据的扩展性等方面提出更多的要求。基于通用存储而专门构建的时间序列数据库开始出现，它可以按时间间隔高效地存储和处理这些数据。像OpenTSDB，KairosDB等等。

这类时序数据库在继承通用存储优势的基础上，利用时序的特性规避部分通用存储的劣势，并且在数据模型，聚合分析方面做了贴合时序的大量创新。比如OpenTSDB继承了HBase的宽表属性结合时序设计了偏移量的存储模型，利用salt缓解热点问题等等。然而它也有诸多不足之处，比如低效的全局UID机制，聚合数据的加载不可控，无法处理高基数标签查询等等。随着docker，kubernetes, 微服务等技术的发展，以及对于IoT的发展预期越来越强烈。

在数据随着时间而增长的过程中，时间序列数据成为增长最快的数据类型之一。高性能，低成本的垂直型时序数据库开始诞生，以InfluxDB为代表的具有时序特征的数据存储引擎逐步引领市场。它们通常具备更加高级的数据处理能力，高效的压缩算法和符合时序特征的存储引擎。比如InfluxDB的基于时间的TSMT存储，Gorilla压缩，面向时序的窗口计算函数p99，rate，自动rollup等等。同时由于索引分离的架构，在膨胀型时间线，乱序等场景下依然面临着很大的挑战。

第三代云时序时空数据库从2016年开始，各大云厂商纷纷布局TSDB，2017.4 Microsoft发布时序见解预览版，提供的完全托管、端到端的存储和查询高度情景化loT时序数据解决方案。强大的可视化效果用于基于资产的数据见解和丰富的交互式临时数据分析。针对数据类型分为暖数据分析和原始数据分析，按照存储空间和查询量分别计费。2018.11 Amazon在AWS re Invent大会发布Timestream预览版。适用于 IoT 和运营应用程序等场景。提供自适应查询处理引擎快速地分析数据，自动对数据进行汇总、保留、分层和压缩处理。按照写入流量，存储空间，查询数据量的方式计费，以serverless的形式做到最低成本管理。

阿里云智能TSDB团队自2016年第一版时序数据库落地后，逐步服务于DBPaaS，Sunfire等集团业务，在2017年中旬公测后，于2018年3月底正式商业化。在此过程中，TSDB在技术方面不断吸纳时序领域各家之长，逐步形成了高性能低成本，免运维，易用性逐步提升，边云一体化，生态丰富等产品优势。

技术揭秘

1. 分布式流式聚合器

时序聚合运算是时序数据库区别于通用数据库的特色之一。TSDB的聚合器主要算子涵盖了插值，降采样，降维等等OpenTSDB协议中的计算函数。借鉴传统数据库执行模式，引入pipeline的执行模式（aka Volcano / Iterator 执行模式）。

Pipeline包含不同的执行计算算子(operator), 一个查询被物理计划生成器解析分解成一个DAG或者operator tree，由不同的执行算子组成，DAG上的root operator负责驱动查询的执行，并将查询结果返回调用者。在执行层面，采用的是top-down需求驱动 (demand-driven)的方式，从root operator驱动下面operator的执行。这样的执行引擎架构具有优点：

这种架构方式被很多数据库系统采用并证明是有效;
接口定义清晰，不同的执行计算算子可以独立优化，而不影响其他算子;
易于扩展：通过增加新的计算算子，很容易实现扩展功能。比如目前查询协议里只定义了tag上的查询条件。如果要支持指标值上的查询条件(cpu.usage <= 70% and cpu.usage <=90%),可以通过增加一个新的FieldFilterOp来实现
从查询优化器到生成执行计划，把查询语句重写成子查询后构建Operator Tree, 执行器驱动Operators完成聚合逻辑，执行Fragment顺序：Filtering -> Grouping -> Downsampling -> Interpolation -> Aggregation -> Rate Conversion -> Functions
区分不同查询场景，采用不同聚合算子分别优化，支持结果集的流式读取和物化, Operator的结果在包含None,dsOp等情况下采用流式聚合，而一些时间线之间的聚合仍然是物化运算。

2.时空数据的查询和分析

在介绍时空数据的查询分析之前，简单介绍下什么是时空数据以及时空数据的特点。

大数据时代产生了大量的有时间和空间、标记对象个体行为的时空数据。

比如个人手机产生的信令数据、共享出行的司乘位置和订单数据、车联网和无人驾驶行业的实时车辆数据、物流的位置流数据，以及外卖小哥的送餐轨迹等，都是这类数据。

时空数据的特点之一是复杂性和目标的多样性，存在许多时空分析方法，比如聚类，预测，变化检测，频繁模式挖掘，异常检测和关系挖掘。

时空数据另外一个特点是数据量级呈指数型增长，也是时序数据的在高维空间的展开。传统数据库可伸缩性差，难以管理海量时空数据。高并发情况下，由于存储和计算没有分离，时空数据的检索会是很大瓶颈，可能造成检索性能急剧下降，响应时间超过数分钟。

面对这样的数据量、计算量和对分析延时要求的挑战，时空数据库TSDB从多个技术维度进行了突破。如存储计算分离、高性能时空索引、时空SQL优化器、时空计算引擎、时空数据压缩算法。

**时空过滤条件的识别与下推 ** 有别于通用数据的<，>和=关系，时空数据的查询过滤条件通常是一些类似于st_contains(), st_intersects() 的空间分析函数。因此SQL优化器会解析识别过滤条件之中的时空过滤条件，根据存储引擎的特性，决定哪些过滤条件可以下推，如果有无法下推的条件，则会将这些条件留在Filter算子之中，由计算引擎来进行过滤。而如果过滤条件可以被下推，则优化器会生成新的Filter算子。优化前后的关系算子如下图所示：

时空计算引擎

在通用数据库中，JOIN是两张表之中某两个列相等，对应的有NestedLoopJOIN、HashJOIN，SortMergeJOIN等算法。

对于时空数据而言，找到两个相等的几何对象几乎不可能，多是基于st_contains()等空间位置关系或是st_distance()距离关系，来做JOIN。

比如找出云栖小镇附近1公里的所有出租车，JOIN条件就是出租车位置要包含在云栖小镇为圆心，半径1公里的圆形空间范围之内；比如找出离我最近的出租车，这就要用到KNN JOIN。而这些JOIN就超出了通用数据库JOIN算法可以优化的范畴。

在时空数据库TSDB之中，采用了专门的Scalable Sweeping-Based Spatial Join算法、时空索引、存储层+计算层的Two level index进行优化。当SQL优化器识别到两表JOIN的条件为时空分析函数时，如果参数等条件都符合要求，则SQL优化器会生成专门的时空JOIN算子，采用专门的JOIN算法来实现，这样的算法比朴素的JOIN算子性能要高出很多。

开源生态

TSDB 提供开源influxDB 和开源Prometheus 两大生态的支持。 influxDB是DBengines上排名第一的时序数据库，阿里云influxDB®在开源influxDB基础之上提供一下功能：

1.水平可扩展集群方案 2.全局内存管理 3.全面兼容TICK生态

水平可扩展集群方案

使用raft实现influxDB数据节点的高可用，同时提供多个高可用方案，让用户可以在可用性和成本中选择最适合自己的方案。
阿里云influxDB®支持根据数据量大小，动态增加influxDB数据节点的高可用组。

全局内存管理

阿里云influxDB®通过对influxDB代码的优化，实现了全局内存管理，可以通过动态调整内存使用
全局内存管理支持阿里云influxDB创建任意多个database
全局内存管理实现了数据写入以及数据查询的内存管理，可以非常显著的防止由于OOM引发的稳定性问题，提高整个系统的可用性

TICK生态兼容

阿里云influxDB全面兼容TICK生态，支持对接telegraf，chronograf以及kapacitor
除此之外，阿里云influxDB支持对接grafana，用户能够使用更加丰富的图形化工具展示influxDB中的数据
阿里云influxDB提供“一键式”的数据采集工具，用户可以非常方便的安装、启动数据采集工具，并且在阿里云管理平台上管理数据采集工具

阿里云influxDB不但提供高可用、集群方案，更加稳定性的服务以及拥抱开源生态，也积极集成数据采集，可视化以及告警等功能，同时提供全自动监控，全托管“无运维”的服务。

Prometheus是K8S开源监控报警系统和时序列数据库，阿里云也提供Prometheus服务。相对于开源Prometheus，阿里云Prometheus有以下特性：

原生态对接Prometheus

无缝对接InfluxDB
无需代码修改、仅需修改配置

长期数据存储

InfluxDB通过Remote Storage长期存储Prometheus数据
InfluxDB远程存储可以实现“多写一读”的查询模式，多个prometheus对接同一个influxDB，允许联合查询多个Prometheus，实现数据“全局化”查询

高可用与高可靠

InfluxDB高可用为Prometheus提供高可用存储功能
InfluxDB使用的云盘实现Prometheus数据高可靠，有效防止数据丢失

阿里云Prometheus充分使用阿里云InfluxDB的能力，增强阿里云Prometheus的能力，实现数据的长期存储，高可用，高可靠，同时实现数据的“全局化”查询。

总结

阿里云时序时空数据库TSDB系列产品，聚焦于物联网、监控APM、交通出行、车联网、物流等行业，致力于打造云边一体化的时序时空数据库，欢迎各位开发者和企业客户使用，给我们提出宝贵意见。

原文链接

本文为云栖社区原创内容，未经允许不得转载。

云栖深度干货 | 打造“云边一体化”，时序时空数据库TSDB技术原理深度解密的更多相关文章

打造“云边一体化”，时序时空数据库TSDB技术原理深度解密
本文选自云栖大会下一代云数据库分析专场讲师自修的演讲——<TSDB云边一体化时序时空数据库技术揭秘> 自修 —— 阿里云智能数据库产品事业部高级专家认识TSDB 第一代时序时空数据处理工 ...
云栖大会压轴好戏阿里云发布视频云V5计划与系列新产品
9月25 - 27日,2019云栖大会如期召开.在大会最后一天下午,阿里云智能视频云分论坛为今年的云栖大会献上了一场精彩的压轴好戏. 视频云V5计划发布使能生态合作伙伴会上,阿里云智能研究员金戈进 ...
零距离接触阿里云时序时空数据库TSDB
概述最近,Amazon新推出了完全托管的时间序列数据库Timestream,可见,各大厂商对未来时间序列数据库的重视与日俱增.阿里云TSDB是阿里巴巴集团数据库事业部研发的一款高性能分布式时序时空数 ...
非IT人士的云栖酱油之行（程序猿迷妹的云栖之行）
摘要: 熟悉我的人都知道,我是一个贪玩儿且不学无术的姑娘,对于互联网我也是知之甚少:这次去到杭州参加阿里巴巴集团主办的为期4天的科技大会也是很例外:但是不得不说这次的会议真是让我很震惊.今天我就和大家 ...
阿里云发布新版SaaS上云工具包，全面助力SaaS上云
9月26日,在云栖大会SaaS加速器专场上,阿里云发布了新版的SaaS上云工具包(SaaS Launch Kit),发布了API网关的新功能,以及推出了全新升级的能力中心. SaaS上云工具包,顾名思 ...
云栖干货回顾 | 云原生数据库POLARDB专场“硬核”解析
POLARDB是阿里巴巴自主研发的云原生关系型数据库,目前兼容三种数据库引擎:MySQL.PostgreSQL.Oracle.POLARDB的计算能力最高可扩展至1000核以上,存储容量可达100TB ...
杂项-分布式-EDAS：深度解析阿里云EDAS服务
ylbtech-杂项-分布式-EDAS:深度解析阿里云EDAS服务 1.返回顶部 1. 深度解析阿里云EDAS服务弹性伸缩摘要: 第一种只适用于业务较少的情况,而在新业务不断增加的情况下,增加新应 ...
2019云栖大会开幕，5G边缘计算成首日焦点
9月25日,全球顶尖科技盛会——2019云栖大会如期上演,1000余位当代技术领军人物与数万名开发者集结杭州,聚焦数字经济,共话面向未来20年的基础科学.科技创新与应用突破.其中,边缘计算技术领域因5 ...
2020云栖大会智慧出行专场：聚焦高精地图/算法、智能模型、自动驾驶、AR导航
2020云栖大会将于9月17日-18日在线举行,届时将通过官网为全球科技人带来前沿科技.技术产品.产业应用等领域的系列重要分享. 阿里巴巴高德地图携手合作伙伴精心筹备了“智慧出行”专场.我们将为大 ...

随机推荐

Codeforces 425B
点击打开题目链接题意:给定一个n×m的0,1矩阵,做多可以对矩阵做k次变换,每次变换只可以将矩阵的某一个元素由0变成1,或从1变成0. 求最小的变换次数使得得到的矩阵满足:每一个连通块都是一个“实心 ...
ASO优化经验：APP关键字优化的技巧
当开发首款产品的时候,可能你根本连ASO是什么都不知道,因为有太多别的事情需要你做.大多数新手开发商甚至到游戏要进入Appstore的时候才知道有“关键字”这件事要去研究.正因为这些开发商几乎没有在关 ...
学生信息管理系统之【修改信息窗口】标签：数据库vb 2014-06-13 21:23 1167人阅读评论(15)
自从开始敲学生信息管理,就发现有几个窗口从来木有成功打开过,它们是(修改学籍信息)(修改成绩信息)和(修改课程信息)窗口,这几个窗口每次想打开的时候都会弹出"实时错误:3021"这 ...
MUI - 实现关闭除指定页面外的其他所有页面的功能
实现关闭除指定页面外的其他所有页面的功能比如在实现注销登录功能时,要保证旧有的webweiw或缓存不影响新用户的操作,就需要在跳转到登陆页面前关闭其他页面. http://www.cnblogs.c ...
IMEI校验思路及代码
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
dva框架简单描述使用
首先传统的create-router-app脚手架生成的脚手架我们写仓库的时候用reducers进行调用还有thunk进行异步操作的时候,需要多层函数进行调用,这样会让我们代码进行维护的时候变得麻烦, ...
SQL Server —— 主键和外键
一.定义 1.1.什么是主键和外键关系型数据库中的一条记录中有若干个属性,若其中某一个属性组(注意是组)能唯一标识一条记录,该属性组就可以成为一个主键. 比如: 学生表(学号,姓名,性别,班级)其中 ...
ELK练习
1.ELK练习 PUT s3/_doc/ { "mappings" : { "doc" : { "properties" : { " ...
WPF Binding ElementName方式无效的解决方法--x:Reference绑定
原文:WPF Binding ElementName方式无效的解决方法--x:Reference绑定需求: 背景:Grid的有一个TextBlock name:T1和一个ListBox,ListBo ...
Nacos Committer 张龙：Nacos Sync 的设计原理和规划
图:Nacos Meetup @杭州与你同行,抬头便是星空. 本文整理自Nacos Committer 张龙的现场分享,阿里巴巴中间件受权发布. 随着 Nacos 1.0.0 稳定版的发布,越来越多 ...

云栖深度干货 | 打造“云边一体化”，时序时空数据库TSDB技术原理深度解密

云栖深度干货 | 打造“云边一体化”，时序时空数据库TSDB技术原理深度解密的更多相关文章

随机推荐

热门专题