1.kudu介绍 1.1 背景介绍 在KUDU之前,大数据主要以两种方式存储: (1)静态数据: 以 HDFS 引擎作为存储引擎,适用于高吞吐量的离线大数据分析场景.这类存储的局限性是数据无法进行随机的读写. (2)动态数据: 以 HBase.Cassandra 作为存储引擎,适用于大数据随机读写场景.这类存储的局限性是批量读取吞吐量远不如 HDFS,不适用于批量数据分析的场景. 从上面分析可知,这两种数据在存储方式上完全不同,进而导致使用场景完全不同,但在真实的场景中,边界可能没有那么清晰,面…