Catalyst Catalyst是与Spark解耦的一个独立库,是一个impl-free的运行计划的生成和优化框架. 眼下与Spark Core还是耦合的.对此user邮件组里有人对此提出疑问,见mail. 以下是Catalyst较早时候的架构图,展示的是代码结构和处理流程. Catalyst定位 其它系统假设想基于Spark做一些类sql.标准sql甚至其它查询语言的查询,须要基于Catalyst提供的解析器.运行计划树结构.逻辑运行计划的处理规则体系等类体系来实现运行计划的解析.生成.优化