在我们之前的文章中,我们讨论了多模式索引的设计,这是一种用于Lakehouse架构的无服务器和高性能索引子系统,以提高查询和写入性能.在这篇博客中,我们讨论了构建如此强大的索引所需的机制,异步索引机制的设计,类似于 PostgreSQL 和 MySQL 等流行的数据库系统,它支持索引构建而不会阻塞写入. 背景 Apache Hudi 将事务和更新/删除/更改流添加到弹性云存储和开放文件格式之上的表中. Hudi 内部的一个关键组件是事务数据库内核,它协调对 Hudi 表的读取和写入.索引是该内核…