导读: 时序数据库(Time Series Database)在最近几年被越来越多的用户接受并使用,并有广泛的应用场景。云原生时序数据库 TDengine 一直稳居墨天轮时序数据库榜首,其近期的海外发展也初见成效。本期,墨天轮技术社区邀请到了涛思数据领航者——陶建辉先生,针对公司创立初心、时序数据库未来发展趋势、数据库出海等话题展开探讨,同时有过三次创业经历的他也将分享自己的心得体会,以及对数据库从业者未来发展的建议!

涛思数据创始人&CEO —— 陶建辉 

TDengine 创始人与核心开发。1994年到美国留学,1997年起,先后在芝加哥 Motorola、3Com 等公司从事无线互联网的研发工作。2008年初回到北京创办和信,后被联发科收购。2013年初创办快乐妈咪,后被太平洋网络收购。2017年5月创办涛思数据,专注物联网大数据的处理,产品 TDengine 开源后,在 GitHub 全球趋势排行榜上多日排名第一。涛思数据已获红杉、GGV、经纬、明势资本等多家机构的近7000万美元的投资。

—— 以下为采访全文 ——

墨天轮社区:您创业选择的行业多样,从通讯、母婴行业再到现在的时序数据库,跨越的幅度也比较大,您最后选择时序数据库是基于怎样的初衷?

陶建辉:我上一家创业公司是做母婴智能硬件,智能硬件产生的数据都是时序数据,因此让我了解到了时序数据这样的场景。在公司被收购后,我看了很多智能硬件、物联网、工业互联网的项目,觉得时序数据的处理是一个共性的、相对标准的需求。而且2016年自动驾驶很火,自动驾驶能产生海量的时序数据,分布式能源也是很多人讨论,这些分布式能源系统产生的数据也是海量的,因此我认为时序数据处理将成为一个重要的技术领域。

调研发现市场上已经有 InfluxDB、OpenTSDB 这些产品,但这些产品做得一般般,并没有充分利用时序数据的特性,而当时 InfluxDB 已经融资6000多万美元,因此我认为这是一个值得创业的赛道。2016年底就自己动手开始写程序,验证自己提出的 “一个数据采集点一张表” 这一数据模型的效率,测试发现,居然写入和查询性能至少比 InfluxDB 快五倍以上,因此我就正式决定融资、组建团队,这样,涛思数据在2017年6月就正式成立了。

墨天轮社区:TDengine 在开源方面是比较成功的,如何在开源的同时实现商业化?

陶建辉:当前 TDengine 主要通过企业版和云服务实现商业化。相比开源版,TDengine 企业版拥有更多企业所需要的数据库运营维护功能,比如数据备份、容灾、加密、安全传输,以及可视化的管理界面、数据的多级存储、边云协同等等。但开源版与企业版的核心功能都是完全一样的。

云服务更多的是面向中小企业用户,是全托管的时序数据处理平台,这也将是我们今后很重要的收入来源。

墨天轮社区:相较于 InfluxDB,TDengine 有哪些差异化的优势?目前您认为 TDengine 最成功的标杆应用案例是什么?

陶建辉:相对于 InfluxDB, TDengine 有以下几方面的优势:

  • 超强性能,基于全球公认的时序数据基准测试结果来看,TDengine 的写入性能是其 3.0 ~ 10.6倍, TDengine 的查询性能是其 1.9 ~ 37.0 倍,平均 11.3 倍,磁盘空间的占用也有明显优势;
  • TDengine 不仅只是一个时序数据库,它还带有缓存、数据订阅、流式计算的功能,是一个极简的时序数据处理平台,这样能大幅降低整个数据平台设计的复杂度和运维成本;
  • TDengine 更简单易用,因为支持标准 SQL。

TDengine 最成功的标杆案例之一应该是跨越速运的车辆轨迹数据处理,在资源的节省方面极其显著。与 Hadoop 系统相比,采用 TDengine 之后,服务器台数由21台降为3台,磁盘空间由每日的352G降为4G,而且运营维护变的极为简单,降低人力成本(详细请看:https://www.taosdata.com/user-cases/4863.html)。

墨天轮社区:最近 AI 热潮来袭,TDengine 在人工智能方面有哪些发展成果及未来规划?

陶建辉:TDengine 一直再筹划进入人工智能领域,因为时序数据分析需要 AI 。我们早已规划用 AI 以及机器学习的方法来做时序数据预测以及时序数据的异常检测,而且通过插件的方式来提供,同时也提供一个分布式计算框架,用户还可以基于这个框架开发并运行自己的算法。这样,传统的基于简单规则的实时预警以及预测就会更加智能、精准,让用户能更好的洞察业务运营的状态,更快更好地做出商业决定,提升整个运营的效率。

墨天轮社区:数据库出海是一个老生常谈的话题。您认为现阶段TDengine的出海道路走得如何?针对中国数据库出海,您有哪些经验和心得分享一下吗?

陶建辉:TDengine 的出海还在尝试之中,已经花了一年时间了,有了一些初步效果。主要表现在两方面,首先,TDengine 英文网站的流量在大幅上升,每天总有人通过这个英文网站联系我们销售;其次,我们在北美已经有付费客户,越来越多的美国公司与 TDengine 在结成合作伙伴关系。

数据库乃至所有2B软件出海很不容易,目前还没有成功的先例。但是数据库软件要获得真正的成功,不沦落为一个系统集成商、软件定制开发商,必须走出海这条路。因为数据库软件是标准化的产品,与文化政治形态关系不大,适合全球推广。而在国内,为软件特别是底层软件买单的理念尚未形成,且整个中国市场不到全球市场的10%,如果放弃90%的市场不做,那很难与海外对手 PK,最后一定会失败。虽然中国在全力支持国产软件,但最终的选择权在用户手上,中国非军工、政府、国企的用户,最终一定会选择使用在全球最有竞争力的开源产品。这样只做国内市场的产品最终会很难过个好日子。

墨天轮社区:您认为目前国产时序数据库的落地情况如何?主要应用在了哪些领域?面临哪些困难和挑战?

陶建辉:中国是制造大国,目前又在全力推动数字化转型,因此时序数据库在中国有很多应用场景。从 TDengine 的安装实例就能看出,从2020年8月 TDengine 开源集群版后,已经有超过25万 TDengine 安装实例,遍布全球50多个国家,但近70%的安装还是在中国。因此中国是需要时序数据库的。

从我们用户来看,用户分布在电力、石油、石化、制造、汽车、矿山、烟草、交通、物流、食品等众多领域。所有需要采集数据的场景,都可以使用时序数据库

在中国面临的最大挑战就是用户不乐意花钱,即使购买,客单价也很难上去。还有一个,中国绝大部分企业还没有购买软件服务的意识,这样导致大部分合同还是永久License,而不是按年续费。

墨天轮社区:您认为初创公司如何才能招到高精尖人才、减少人才流失?

陶建辉:第一,待遇要到位,总的待遇包一定要超过华为、阿里、腾讯等企业,否则绝大部分高端人才不会加盟;第二,要有梦想,公司的发展要有足够大的空间和市场价值,这样优秀人才的个人价值才能充分体现。减少人才流失,不外乎几个手段:

  • 待遇需要依据市场的变化做出调整;
  • 打造企业文化和价值观,多关心员工并处处为他着想,让他感觉到被尊重、是公司大家庭的一份子;
  • 要多交给有挑战性的工作,让他觉得有施展才华的舞台,让他能看到公司的成长以及他个人的成长。

墨天轮社区:您创业到现在有15年了,讲讲您最难的时候。为什么会陷入危机? 是怎么渡过的?

陶建辉:我创业最难的时候,是2010年年初,公司(和信)一分钱都没有了,办公室因为拖欠房租都被封了,完全是走投无路。但我当时坚信,我做的手机消息推送服务一定有市场,技术绝对领先,因此我就咬牙扛了下来,找同学、朋友借钱度过的难关。幸运的是,我坚持几个月后,和信就被台湾的联发科收购了。

墨天轮社区:都说35岁是技术从业者的一道坎,面对年龄焦虑,您认为数据库从业者如何摆正心态、坦然面对?

陶建辉对于数据库开发而言,35岁是刚刚开始的年龄。 要成为系统软件的开发高手,大学毕业后,如果没有十年以上的技术磨炼,是难开发操作系统、数据库这类软件的。而且这十年,是需要有研发高手指导、参与过同样复杂度软件开发的。另外一方面,应用软件的开发每一年都不同,各种语言、工具层出不穷,但对于数据库的开发而言,五年、十年都几乎没有什么变化,因为底层技术的改变是缓慢的,很适合35岁以后的人来做,因此数据库的研发特适合能坐得住、能且乐意啃硬骨头的人做


阅读原文:https://www.modb.pro/db/633711

欲了解更多可浏览墨天轮技术社区,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。

墨天轮专访TDengine陶建辉:坚持做难而正确的事,三次创业成就不悔人生的更多相关文章

  1. TDengine陶建辉 自带聚光灯&BGM的半百少年

    TDengine,这款定位为“专为物联网而生的大数据平台”,引爆了2019年夏天的软件圈. 2019年7月12日,涛思数据宣布将TDengine的内核(存储和计算引擎)以及社区版100%开源. 201 ...

  2. three.js实现分模块添加梦幻bloom辉光光晕方案--详细注释版本~~方案三版本~~

    先上图对比方案1-2-3不同点,本文是方案3 方案1(旋转场景情况下发光体不应该遮住另一个,但是遮住了) 方案2(层次正常,发光正常) 方案3(层次正常,发光正常,但是转动场景时候部分辉光会被遮挡,但 ...

  3. 万字详解 TDengine 2.0 数据复制模块设计

    ​导读:TDengine分布式集群功能已经开源,集群功能中最重要的一个模块是数据复制(replication),现将该模块的设计分享出来,供大家参考.欢迎大家对着设计文档和GitHub上的源代码一起看 ...

  4. 万字详解TDengine 2.0整体架构设计思路

    ​导读:涛思数据8月3日将TDengine 的集群功能开源,TDengine具有超强的性能和功能,为什么能做到?它到底有哪些技术创新?今将TDengine的整体设计文档分享出来. 1: 数据模型 物联 ...

  5. 第四朵“云”!全托管的时序数据云平台 TDengine Cloud 正式支持阿里云

    3 月 13 日,全托管的时序数据处理云服务平台 TDengine Cloud 正式支持阿里云,这是继 Microsoft Azure.AWS.Google Cloud 后 TDengine Clou ...

  6. OtterTune来了,DBA怎么办

    https://blog.csdn.net/xiangzhihong8/article/details/72887476 最近AI的新闻特别多,席卷了围棋圈之后,成为了技术圈和媒体热捧的话题. 今天又 ...

  7. 【科创人·独家】MegaEase左耳朵耗子陈皓复盘创业:第一年盈利被当骗子,线下广阔天地大有可为

    [科创人·独家]MegaEase左耳朵耗子陈皓复盘创业:第一年盈利被当骗子,线下广阔天地大有可为 原创: babayage CTO科创圈  与上百位科技创业者共同关注科创人的成长心路. 文末有彩蛋:& ...

  8. 60秒定位问题,十倍程序员的Debug日常

    作者:陶建辉 这是我在 2020 年 5 月写的一篇内部博客,当时是希望研发和技术支持同学能够帮助用户快速定位 Bug,解决问题.2020 年 12 月我又迭代了一版,并还针对此进行了内部的培训.这段 ...

  9. durex-word

    "(半夜没睡着) “你是不是饿了,哎呀我也饿了.”" "(聊到合拍处) “我和你有一万句me too想要说.”" "(异地恋) “我辞职,去你那儿吧! ...

  10. Go语言的成功也预示着Rust的成功【转】

    从整体的角度来看Go,很难理解他是怎么取得这么大的成功的.从理论的角度上来说Go是一门非常糟糕的语言,就算是和C++或者Ada之类旧语言相比也是这样. 从整体的角度来看Go,很难理解他是怎么取得这么大 ...

随机推荐

  1. P6764 [APIO2020] 粉刷墙壁

    思路: 本质上能进行的操作就是我们算出从第 \(i\) 块砖开始,连续刷 \(M\) 块砖,是否有承包商可以刷出期望颜色. 那么设 \(f_i\) 表示 \([i,i+m-1]\) 是否合法,那么就变 ...

  2. 关于工业AI辅助制造(模具设计、模样生产制造环节)

    关于工业AI辅助制造(模具设计.模样生产制造环节) AI技术的具体使用场景: AI辅助模具设计: AI辅助模具安装工艺参数调整. 具体方案设想: AI辅助模具设计: 使用AI大模型对历史已有的设计方案 ...

  3. 特朗普开始在YouTube上打竞选广告了 —— 美国总统的竞选广告已经开始媒体投放了

    相关: 拜登开始在YouTube上打竞选广告了 -- 美国总统的竞选广告已经开始媒体投放了 PS. 又多了一个猴上台,哈哈哈. 特朗普的竞选资金筹集网站:

  4. YouTube上的很多时视频就是有问题的,还经常不允许评论,妥妥的双标网站

    过多的事情不说了,这些个外国反华势力的网站真是无时无刻的不在视频中加私货,你想评论吧他还能判断你的个人价值观来预估你的评价倾向然后禁止你评价,十分的气人.要是立场不够坚定的人真的是很容易被带偏,像这种 ...

  5. 如何在通用异常处理时获取到方法名称(获取注解参数JoinPoint)

    1.背景 很多时候我们在梳理公共异常时,需要获取到接口的而具体名称,便于很好的提示是那个接口错误了 2.实现逻辑 1.在controller方法上的注解上写方法名称,一般使用了swagger都有方法名 ...

  6. [BJOI2016] IP地址 题解

    前言 来个不一样的做法,用到了 Trie 树和主席树,并且是可爱的在线算法. 题目链接:洛谷. 题目分析 对于一个查询 \(\texttt{ip}\),只考虑所有前缀字符串规则.以时间建里横轴,匹配长 ...

  7. Canvas简历编辑器-图形绘制与状态管理(轻量级DOM)

    Canvas简历编辑器-图形绘制与状态管理(轻量级DOM) 在前边我们聊了数据结构的设计和剪贴板的数据操作,那么这些操作都还是比较倾向于数据相关的操作,那么我们现在就来聊聊基本的图形绘制以及图形状态管 ...

  8. CC2530系列课程 | IAR新建一个工程

    之前录制了无线传感网综合项目实战课程,这个课程非常适合应届毕业生和想转行Linux的朋友,用来增加项目经验. 其中一部分内容是关于CC2530+zigbee的知识,后面会更新几篇关于cc2530的文章 ...

  9. 【团队建设】如何做好团队开发中的 CodeReview(代码评审)?

    目录 前言 一.为什么要做 二.有哪些好处 三.具体怎么做 3.1评审条件 3.2评审重点 3.3评审形式 四.还可以怎么做 4.1提出亮点 4.2轮流评审 4.2文档沉淀 五.文章小结 前言 你是否 ...

  10. LeetCode300.最长递增子序列

    LeetCode300.最长递增子序列 力扣题目链接(opens new window) 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度. 子序列是由数组派生而来的序列,删除(或不删除 ...