为了帮助卖家提高运营水平,卖家管理后台会展示一些访客.订单等趋势和指标数据,如PV,UV,转化率,GMV等: 这些指标的计算依靠前端埋点和订单详情等数据,其特点是数据量大,并有一定的实时性要求. Druid本质是一个分布式时序数据库,其设计恰好满足这个场景: Historical数据存储使用HDFS等成熟的分布式文件系统方案,高可用.水平扩容 Lambda架构,Realtime部分使用LSM-Tree实现,满足流数据的即时查询需求 下面从2方面,整理一下Druid的关键技术点: Druid架构设