来源:云数据库技术

数据库打工仔喃喃自语的八卦历史

1. 为导弹巡洋舰设计,用在手机上的数据库

2. Small and Simple, and Better

3. 如何看出是自己的娃:产品定位,特点和边界

1. 产品设计

作为产品设计/产品管理的从业者,日常工作的一个核心就是明确产品的优势和定位,加上同样重要,又常常被忽略的维度:产品边界

姚明是中锋,并不是说他不能像后卫一样投三分,他明确的知道自己的长处和定位,和能力边界。

我们今天就讨论一个数据库专注细分领域的,甚至可以说是小众的,但是又最流行的,产品边界清晰的数据库 SQLite

编辑

SQLite Logo

图片来源 - SQLite.org

2. SQLite - 兆级数据库

从数据库实例维度,全世界最流行的数据库,不是那些数据库元老(O,DB2,SQL Server), 不是云上新贵(Aurora, Snowflake, Azure),不是开源MySQL/PG, 不是大数据HBase/Spark。他们加在一起,也比不上SQLite的零头。

现今世界上正在运行的SQLite,有超过万亿(1000B,1e12)的实例。每一位现代人的日常是被SQLite围绕的 :

• 所有的Android手机/手环(华为,小米,三星...)

• 所有的苹果iOS设备手机/Pad/手表

• 所有的苹果电脑 Mac

• 所有的微软Windows10电脑

• 通用浏览器(Firefox, Chrome, and Safari)

• 智能电脑/机顶盒

• 车载多媒体系统

• ....

SQLite不需要传统意义的安装,部署,调试,是纯粹意义上的Zero-Configuration。不需要DBA, It just work for a developer,甚至许多i/OS, andriod手机APP的开发者,根本不知道他们在使用SQLite。

3. SQLite 产品设计

产品设计,开发实现与应用实践,三者之间不是流水线或waterfall的单行道,而是循环往复,螺旋上升的。

SQLite由Dwayne Richard Hipp个人开发开源的。Hipp也算是计算机领域中N多个从学校肄业的大牛之一,区别在于Hipp是在Duke读博士的时候才悟出来的,比Gates(大三) 和Jobs(大一)逊色不少。当年2000年甲方爸爸,世界五大国防工业提供商(俗称军火制造商)之一,列入Fortune 100的 通用动力公司(General Dynamics)需要为美国海军的提供软件系统,Hipp是其中一个临时工。

如果对GD不熟悉,那可以补课旗舰产品F-16

Hipp作为政府的合同工,恰巧因为联邦政府关门(对的,就是那种没有钱导致的政府关门),暂时失业了。待业在家(笔者刚刚短暂的享受了几天),Hipp搞出的事情就是写个数据库,处理个战舰损管控制系统。

2.1 需求

编辑

驱逐舰 奥斯卡.奥斯丁舰名来自荣誉勋章获得者奥斯丁下士图片来源 - wiki百科

做数据库的产品经理可能很难遇到如此具体的需求,驱逐舰奥斯卡.奥斯丁上的某个任务对话框弹出DBA梦幻信息:

Can’t connect to database server

而这个任务是战斗损管系统,也就是在弹雨枪林下,水深火热中,需要报警表示那些管道/设施需要应急维修。真枪实弹的秒级交互场景中,如果出现数据库无法联接,操作员心中怎能不万马奔腾?

这个联系不上的数据库系统,是当年赫赫有名的Informix。虽然不如Oracle, Db2(那是还没有SQL Server的时代),Informix也是top5 的数据库,二十年前被IBM用10亿美刀收购,也算体现价值了。可是Informix不是为这个业务场景设计的,事实上当年没有任何一款数据库符合此场景。

2.2 边界:不是什么

一方面Informix和已有数据库不适合上述场景,另一方面产品也不用背负老系统的功能集和业务职责。

NOT another RDBMS

• 不是替代当年成熟的数据库(Db2, Oracle)

• 不是(2000年代)新宠的数据仓库(Netezza, greenplum)

• 不是复杂的服务器Server-base系统

• 速度不是重要指标

• 存储量也不是重要指标

• 跨平台不是设计指标(对比2000 java的崛起)

• 功能齐全不是设计目的

2.3 定位:为单一APP服务的数据库

SQLite是自己自足Self contained的关系数据库管理系统,直接服务某应用某块。此概念与现在流行的microservices有类似之处。

SQLite面临的不是提高Informix链接数,复杂的链接池算法,或者断点续连的问题。而是面向的是每一个控制模块需要恶劣环境下,甚至出现物理切割的情况下,单模块系统依然可以对立运行,完成大部分设计功能。特别明确一下,这里的模块指代某个硬软件一体的工业模块,不是数据库内部的纯软件模块。

让我们做一个业务对比:现在中国的银行系统是采用中心体系的,每次一个支行或柜员机的业务操作是与总行数据中心连接完成的。好处是用户可以跨区域跨分行操作,异地存储转账,不足是如果与总行的线路出现问题,分行是瘫痪的。而SQLite的定位是,在正常情况下与总枢纽指挥中心联络,通讯通道异常时,比如前炮台,后轮机,均需要独立完成90%以上的职责。

2.4 特点(优点):NOT Faster, Better, Cheaper

咬文嚼字的说,优点是销售词汇,产品设计角度应该强调的是特点。特点在适合的场景中才是优势。SQLite,不是最快最大最全的数据库,恰恰相反它是最小的标准数据库RDBMS。

SQLite的特点是如此明显的,所以宣传它不用那些看不出产品特点的片儿汤话。事实上SQLite的早期成功同商务宣传没有半毛钱关系。它为一个特殊的细分市场提供了具有基础数据库能力的嵌入式系统,这个细分市场在短短几年跳跃进庞大的智能手机时代,而SQLite的生命力强大到轻轻松松的站在时代的浪尖。

2.4.1 小:Small and Simple

通过C编写,在正式发布5年之后,向Google/Andriod的推广时,SQLite的binary也不过250KB。出世20多年过程中,添加了全文检索,CTE,JSON等高级功能后,SQLite的发布版也只有小小的700KB。

今日头条( andriod版)的安装后大小161MB,1:200的关系。对了,今日头条APP中很可能也用了SQLite(请字节同学确认,同样问题抛给阿里淘宝,腾讯微信)

SQLite其实很"大",3.33.0(2020GA)可以最大支持281TB的数据。其系统测试分四大类,几百万测试case。即使最小的,为开发程序员日常check in的把关的“very quick”的Tcl 测试,也有30万个。它对产品质量的重视,是否可以让许多大厂的号称企业级的系统测试汗颜了[^9]。

[^9]: How SQLite Is Tested https://sqlite.org/testing.html

2.4.2 标准数据库

1. 支持数据库最重要的事务ACID。

2. 兼容标准的SQL-92,第一版SQLite 1.0使用PostgreSQL6.5语法。

3. C/C++ interface作为原始编程语言接口,为后期衍生开发提供可扩展的链接

2.4.3 嵌入式

大家熟悉数据库系统,Oracle, DB2, MySQL等,是存在于应用程序之外的独立系统,一个Oracle为多个应用服务。还以银行系统为例,应用(application)包括存取(强事务write),流水单(单储户Read Only),储户留存分析(月底报表, BI Report),都可以在同一个Oracle集群上操作。

SQLite是嵌入式的数据库,作为应用(APP)的一个部件,同时安装,同应用和用户常常都是一对一关系。SQLlite的赋予了它可以被嵌入的能力。

2.4.4 利用文件系统

定位决定了特殊性:并发少,权限管理简单,性能要求不高。

SQLite不用类似系统级数据库,深度管理定制的存储管理系统,比如MySQL 开发自己的innoDB, TiDB 采用TiKV和RocksDB。SQLite依赖操作系统自带的文件系统,读写自己DB file,并且继承文件系统的权限管理。

此设计理念简化系统复杂度,但也并不是没有缺陷。并发读写就是SQLite的明显短板之一。因为整个数据库是一个大文件,依靠文件锁来控制读写冲突。只有在后期(2010)实现WAL后,才提供了并发功能,当然也是有代价的。

2.4.5 Serverless

大家常常混淆了“Serverless”这个技术,与云Serverless Computing 这个技术+业务手段,比如[Serverless Database] (https://en.wikipedia.org/wiki/Serverless_computing#Serverless_databases),其实还是client/server的服务架构,准确的说是有服务器(Server)的。

Serverless作为一个技术,其经典定义(现在比较小众了)就是纸面意思:没有服务器/no server。SQLite是Serverless,因为它与应用程序的同一个进程内运行,公用共享同一块内存空间,相互之间直接读写,而不通过消息协议(比如RPC call)和网络交互。

2.4.6 "官方"认证

美国国会图书馆,又称美国国家图书馆(Library of Congress) 推荐的独立于平台的开放格式的四种数据存储格式之一。

此官方认证与国内的政府认证,语音类似,差距很大。

3. 马后炮,评英雄

《成功学》最重要的优势就在于:面对一个已经成功的产品,项目,人或者团队,总结(堆砌)其英明决策。

现实世界是黑白多变的,历史偶然性多于必然性,尤其是具体的人和事。回头看SQLite, 也是可以总结一些契机和事后方知的因素,促成了它的今天。

3.1 项目 vs. 产品

SQLite肯定不是某领导英明决策的结果。本来是个项目(解决Informix掉链问题),Hipp闲的无聊把它作成了产品。

反观许多产品团队打着产品的名号做项目。在短期业务压力下,或者是因为大厂内部竞争,或者因为初创企业生存压力。团队早期做有生命力有世界水平数据库的梦想,很快向现实环境低头了。被甲方爸爸或领导指挥左右,对自己的产品拔苗助长。项目也许拿下了的代价是产品做残了。

3.2 开源

SQLite从第一天就是开源的,特别要明确一下,不是开源项目。

Hipp一个人开发,开源的。他没有想到SQLite二十年后支持了现代人的分分秒秒的日常生活。甚至在头几年,Hipp都不知道谁使用,搞笑的是他之所以了解到通用电气和日立青睐SQLite,是因为出口管制需要走法律流程时,两个大厂不得不找Hipp了解情况。他才知道已经被白嫖多年。

很幸运的是,Hipp这个工程师得到一个有法务背景的IT商人, Mitchell Baker, CEO of Mozilla Foundation,指导和帮助。SQLite才真正成为一个项目SQLite联盟 ,有了稳定的资金,同时又保留了开发者主导决策产品的发展的权利。

3.3 Google和Andriod

SQLite唯一获得的奖项是2005 Google O’Reilly Open Source Award。

当iphone/智能手机被业界认为是后PC革命的时候,smartphone已经开始使用SQLite, Symbian(Nokia)属于最早的之一。

Google/Andriod在iphone获得早期风光之后,也走进了掌上的舞台。他们选中了SQLite。于是所有的Andriod APP, 都用SQLite作为默认的数据库管理。实际情况是APP开发者并不了解数据库,也没有动力去选型。APP使用SQLite因为Google/Andriod是选择(平台作用),也是所有APP教程的选择(生态作用)。

3.4 测试

SQLite突然直面了百万的用户,各种bug如雨后春笋一般暴露出来。Hipp花了整整一年时间写测试用例。大多数产品在GA,商业化之后,很难有时间和机会专门提供测试覆盖和产品质量。Hipp是幸运的,在关键时刻等到认可和资助;SQLite是幸运的,它是开发者的孩子而不是简单的赚钱的工具。SQLite像是成长中的少年,等到了机会,吸收了营养,长大成人。

4. 一点感触

4.1 业务引导技术方向 - 国内和国际不同的实践

技术服务业务,是行内比较普遍的认知,合乎逻辑。但当我们看到细节的时候,会发现国际和国内的明显不同。

中国和欧美IT技术开发既有相似处,比如美国为联邦政府提供IT软件服务也有类似中国的认证流程,本着对纳税人负责的态度,严谨但也死板,同时政府也常常是重要的金主甲方。不同点是,中国政府可以集中力量办大事,远的高铁,近期的芯片和新能源汽车,政府的方向性是明确清晰的。国际上,技术革新的大方向常常是技术公司和商业引导的,比如说Telsa/SpaceX的跨时代的突破,基本上没有政府的引导,更准确的说是Telsa引导(游说)政府给以免税政策。

具体到SQLite这个国家图书馆的“官方”认证,说起来很有力,其实对于SQLite的成败影响力就非常有限了。

一点感想吧,如果读者的产品计划进军国际市场,个人建议:

• 业务销售人员要积极关注政府合规认证;

• 技术开发人员专注设计前沿和产品实现,切忌迎合。

4.2 描述产品的片儿汤话

产品常见的商业口号同质化严重,基本上是快好省的衍生词汇。

比如:"与 MySQL 和 PostgreSQL 兼容的关系数据库,专为云而打造。性能和可用性与商用数据库相当,成本只有其 1/10" , 2022年9月13日摘抄AWS Aurora 官网。如果是某个领域的先行者,比如Aurora,倒也罢了,因为是采用了某个突破性新技术,可以担当快好省的评价。之后的追随者,也如此定位宣传,就有些东施效颦的偷懒和尴尬了。

PPT/胶片是技术产品人员常常使用的工具,评价一个材料的好坏,用心与否,可以把PPT中的产品名字盖住,用模版的把颜色和字符统一一下,是否还能看出是哪一个大厂的哪一款产品?粗略估计,80%的产品描述过不了此关。

5. 八卦篇

阿波罗登月

提到小而精的经典程序,必须跪拜一下阿波罗登月计划中的AGC系统,提供登月过程中航天器的制导、导航和控制。全部系统安装在72KB的只读ROM里(头条APP的2千分之一),运行空间是4KB(byte) RAM(约为本篇Markdown文本的四分之一)。

友情奉送Github打卡地址,膜拜一下阿波罗 11 号导航软件AGC中指令模块(Comanche055)和登月模块(Luminary099)原码。

当然再牛的软件都有bug, 如果论如果论惊险性,AGC的1202肯定是历史前10的。有兴趣的同学,可以移步[代码1202,50年前的阿波罗登月给自动驾驶汽车留下宝贵一课](https://www.sohu.com/a/327610148_115873),或英文原版[Apollo 11's Infamous Landing Error Code 1202 Offers Earthly Lessons For Self-Driving Cars](https://www.forbes.com/sites/lanceeliot/2019/07/16/apollo-11s-infamous-landing-error-code-1202-offers-earthly-lessons-for-self-driving-cars)。

花无百日红

讽刺的是SQLite当年并没有被GD采纳,因为决策者还是保守的使用成熟且风险小的Informix。

SQLite的设计也没有考虑到现在强烈的端(手机)和云之间的数据协同/同步需求。加上SQLite不隶属于大厂,商业竞争过程中渐渐被同类产品压迫。比如Google大力扶持的firebase 端云系统,MongoDB并购了Realme也是为此服务。业界比较成功的云原生的时序数据库TDengine也在接口了除SQLite以外的多个端侧数据采集模块。

随着手机市场的成熟,IoT和智能汽车的发展,SQLite的强力竞争者将越来越多。SQLite步入软件的中年危机,我们拭目以待,期望它老而弥坚吧。

6. 信息来源

由于平台对应引用链接的限制,无法准确标注信息来源。需要了解,请参考原文https://github.com/nidmgh/ArmoryBase/blob/main/chapters/06-SQLite.md

​https://www.discovermagazine.com/the-sciences/apollo-11s-1202-alarm-explained​

​https://en.wikipedia.org/wiki/Apollo_Guidance_Computer​

​https://www.sqlite.org/mostdeployed.html​

​https://www.loc.gov/preservation/resources/rfs/data.html​

​https://www.discovermagazine.com/the-sciences/apollo-11s-1202-alarm-explained​

​https://en.wikipedia.org/wiki/Apollo_Guidance_Computer​

​https://github.com/chrislgarry/Apollo-11/​

​https://thenewstack.io/the-origin-story-of-sqlite-the-worlds-most-widely-used-database-software/​

https://sqlite.org/testing.html, How SQLite Is Tested

​https://www.baike.com/wiki/%E5%A4%9A%E5%BF%AB%E5%A5%BD%E7%9C%81​

​https://www.baike.com/wiki/%E7%89%87%E5%84%BF%E6%B1%A4%E8%AF%9D​

​https://www.sohu.com/a/327610148_115873​

​https://www.forbes.com/sites/lanceeliot/2019/07/16/apollo-11s-infamous-landing-error-code-1202-offers-earthly-lessons-for-self-driving-cars​

数据火器库八卦系列之瑞士军刀随APP携带的SQLite的更多相关文章

  1. 超级好用的 Java 数据可视化库:Tablesaw

    本文适合刚学习完 Java 语言基础的人群,跟着本文可了解和使用 Tablesaw 项目.示例均在 Windows 操作系统下演示 本文作者:HelloGitHub-秦人 HelloGitHub 推出 ...

  2. python中令人惊艳的小众数据科学库

    Python是门很神奇的语言,历经时间和实践检验,受到开发者和数据科学家一致好评,目前已经是全世界发展最好的编程语言之一.简单易用,完整而庞大的第三方库生态圈,使得Python成为编程小白和高级工程师 ...

  3. Python库 - Albumentations 图片数据增强库

    Python图像处理库 - Albumentations,可用于深度学习中网络训练时的图片数据增强. Albumentations 图像数据增强库特点: 基于高度优化的 OpenCV 库实现图像快速数 ...

  4. 爬虫 Http请求,urllib2获取数据,第三方库requests获取数据,BeautifulSoup处理数据,使用Chrome浏览器开发者工具显示检查网页源代码,json模块的dumps,loads,dump,load方法介绍

    爬虫 Http请求,urllib2获取数据,第三方库requests获取数据,BeautifulSoup处理数据,使用Chrome浏览器开发者工具显示检查网页源代码,json模块的dumps,load ...

  5. Unix环境高级编程(二十一)数据库函数库

    本章的内容是开发一个简单的.多用户数据库的C函数库.调用此函数库提供的C语言函数,其他程序可以读取和存储数据库中的记录.绝大部分商用数据库函数库提供多进程同时更新数据库所需要的并发控制,采用建议记录锁 ...

  6. Python数据可视化库-Matplotlib(一)

    今天我们来学习一下python的数据可视化库,Matplotlib,是一个Python的2D绘图库 通过这个库,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率图,条形图,错误图,散点图等等 废 ...

  7. 【Tool】Augmentor和imgaug——python图像数据增强库

    Augmentor和imgaug--python图像数据增强库 Tags: ComputerVision Python 介绍两个图像增强库:Augmentor和imgaug,Augmentor使用比较 ...

  8. 3年磨一剑,我的前端数据 mock 库 http-mock-middleware

    不好意思,离开博客园4年多了,一回来就是为自己打广告,真是害羞啊... http-mock-middleware 是我最近完成的一个前端数据 mock 库.它是我汇总近3年工作经验而诞生的一个工具,使 ...

  9. 13 个最佳 JavaScript 数据网格库

    13 个最佳 JavaScript 数据网格库   转自:开源中国 www.oschina.net/translate/best-javascript-data-grid-libraries Java ...

随机推荐

  1. 重写Object的equals方法和Objects的equals方法

    Object类的equals方法默认比较的是两个对象的地址值,没有意义 所以我们需要重写equals方法,比较两个对象的属性值(name,age等等): 对象的属性值一样返回true否则返回false ...

  2. qbxt五一数学Day3

    目录 1. 组合数取模 1. \(n,m\le 200\),\(p\) 任意 2. \(n,m\le 10^6\),\(p\ge 10^9\) 素数 3. \(n,m\le 10^6\),\(p\le ...

  3. 使用jmh框架进行benchmark测试

    性能问题 最近在跑flink社区1.15版本使用json_value函数时,发现其性能很差,通过jstack查看堆栈经常在执行以下堆栈 可以看到这里的逻辑是在等锁,查看jsonpath的LRUCach ...

  4. 官宣!DolphinScheduler 毕业成为 Apache 软件基金会顶级项目

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于北京时间 2021年4月9日在官方渠道宣布Apache DolphinScheduler 毕业成为Apache顶级项目.这 ...

  5. ajax初识

    Ajax 全称为:"Asynchronous JavaScript and XML"(异步 JavaScript 和 XML) 它并不是 JavaScript 的一种单一技术,而是 ...

  6. FPGA/Verilog 资源整理

    verilog学习教程(以Vivado为载体)https://vlab.ustc.edu.cn/guide/index.html 中科大的数电实验网站https://vlab.ustc.edu.cn/

  7. React报错之Encountered two children with the same key

    正文从这开始~ 总览 当我们从map()方法返回的两个或两个以上的元素具有相同的key属性时,会产生"Encountered two children with the same key&q ...

  8. 前端须知的 Cookie 知识

    文章已收录到我的 GitHub 中,欢迎 star cookie 是什么和使用场景 cookie 是服务器端保存在浏览器的一小段文本信息,浏览器每次向服务器端发出请求,都会附带上这段信息(不是所有都带 ...

  9. 解决使用(Jenkins检出代码)git clone检出代码提示必须安装 .NET framework,Version =v4.7.2

    一.事件背景 真的是非常想使用pipeline流水线进行自动化部署打包测试. 于是,晚上下班回家后,真的是"现学现卖",开始做流水线脚本. 经过不懈努力,熬到凌晨两点多,终于把整个 ...

  10. React报错之Property 'value' does not exist on type EventTarget

    正文从这开始~ 总览 当event参数的类型不正确时,会产生"Property 'value' does not exist on type EventTarget"错误.为了解决 ...