sql2rel的过程是将SqlNode 转化成RelNode的过程

在 SqlToRelConverterTest中添加样例测试

  @Test void testScan() {

    String sql = "SELECT * FROM EMP WHERE empno < 10";

    sql(sql).ok();

  }

会生成如下的relnode tree.

LogicalProject(EMPNO=[$0], ENAME=[$1], JOB=[$2], MGR=[$3], HIREDATE=[$4], SAL=[$5], COMM=[$6], DEPTNO=[$7], SLACKER=[$8])

  LogicalFilter(condition=[<($0, 10)])

    LogicalTableScan(table=[[CATALOG, SALES, EMP]])

Validator

registerQuery

主要实现类是在SqlValidatorImpl

org.apache.calcite.sql.validate.SqlValidatorImpl#registerQuery()

主要做的事就是遍历这个query将各个部分的SqlNode对应的SqlValidatorScope以及SqlValidatorNamespace保存起来，供后续validate和sql2rel阶段使用。

这两个概念看起来有点重复，看注解的意思应该是scope主要负责name-resolution，将一个name 解析成相应的namespace来

* Name-resolution scope. Represents any position in a parse tree than an

* expression can be, or anything in the parse tree which has columns.

*

* <p>When validating an expression, say "foo"."bar", you first use the

* {@link #resolve} method of the scope where the expression is defined to

* locate "foo". If successful, this returns a

* {@link SqlValidatorNamespace namespace} describing the type of the resulting

* object.

而namespace描述了SqlNode所对应的relation，如返回类型

 * A namespace describes the relation returned by a section of a SQL query.

在convertQuery完成后就注册了整个Query的各个SqlNode的映射关系

validate

注册完成后会执行validate阶段，这部分会涉及语义，类型等校验，比如校验select的where条件

condition中没有aggregate或window aggregate
condition Node 自身的校验逻辑(最终还是会路由到SqlValidator的实现上)
校验返回类型是boolean的

校验完成之后就会调用下面的接口开始进行toRel的转化

SqlToRel

转化的入口

org.apache.calcite.sql2rel.SqlToRelConverter#convertQuery

这里面最重要的就是通过 convertQueryRecursive递归的进行转化

convertSelect

SELECT `EMP`.`EMPNO`, `EMP`.`ENAME`, `EMP`.`JOB`, `EMP`.`MGR`, `EMP`.`HIREDATE`, `EMP`.`SAL`, `EMP`.`COMM`, `EMP`.`DEPTNO`, `EMP`.`SLACKER`

FROM `CATALOG`.`SALES`.`EMP` AS `EMP`

WHERE `EMP`.`EMPNO` < 10

我们这个query的主体是一个SqlSelect所以会通过convertSelect来转化

public RelNode convertSelect(SqlSelect select, boolean top) {

    final SqlValidatorScope selectScope = validator().getWhereScope(select);

    final Blackboard bb = createBlackboard(selectScope, null, top);

    convertSelectImpl(bb, select);

    return castNonNull(bb.root);

}

封装了两个对象 SqlValidatorScope 和 Blackboard。最后我们转化完成的RelNode的root会保存在blackboard中，也就是bb.root.

convertFrom

`CATALOG`.`SALES`.`EMP` AS `EMP`

convertSelect的第一步就是先转化From子句, from 子句有很多种可能, 例如以下这些

a single table ("SALES.EMP"),

an aliased table ("EMP AS E"),

a list of tables ("EMP, DEPT"),

an ANSI Join expression ("EMP JOIN DEPT ON EMP.DEPTNO = DEPT.DEPTNO"),

a VALUES clause ("VALUES ('Fred', 20)"),

a query ("(SELECT * FROM EMP WHERE GENDER = 'F')"),

or any combination of the above.

这个例子里是一个 CATALOG.SALES.EMP的 SqlIdentifer 然后就会根据这个identifier通过CatalogReader查找这个identifier所表示的table。然后会基于此创建出LogicalTableScan并将该RelNode设置到 BlackBoard中.

convertWhere

`EMP`.`EMPNO` < 10

通过Blackboard#convertExpression将上述的SqlBasicCall转化成RexCall (where条件中的是一个rex表达式)

然后会基于Blackboard的当前的root作为input创建一个LogicalFilter节点

final RelNode filter =

    filterFactory.createFilter(bb.root(), convertedWhere2, ImmutableSet.of());

final RelNode r;

final CorrelationUse p = getCorrelationUse(bb, filter);

if (p != null) {

  assert p.r instanceof Filter;

  Filter f = (Filter) p.r;

  r =

      LogicalFilter.create(f.getInput(), f.getCondition(),

          ImmutableSet.of(p.id));

} else {

  r = filter;

}

bb.setRoot(r, false);

这里会先基于前面创建的RexCall创建出filter节点，但是还会看一下这个filter中是否有 correlation variables. 如果有的话需要将这个CorrelationId 添加到Filter中，这个样例中并没有使用。

到这里RelNode tree 已经是

LogicalFilter(condition=[<($0, 10)])

  LogicalTableScan(table=[[CATALOG, SALES, EMP]])

Correlation

@Test void testCorrelationInWithSubQuery() {

    String sql = "select deptno\n"

        + "from emp\n"

        + "where deptno in (select deptno\n"

        + "    from dept\n"

        + "    where emp.deptno = dept.deptno\n"

        + "    and emp.deptno = dept.deptno)";

    sql(sql).withExpand(false).withDecorrelate(false).ok();

}

上面提到在convertWhere产生Filter的时候需要处理是否有Correlation variable的场景，而这段sql就会产生这种case。correlation其实就是关联的意思，而这里where in 子句中引用了外层的emp表，所以是一个关联子查询

在WHERE的 in 的子查询中 from 只有 dept表，但是条件引用了外层查询的emp表，所以会产生一个关联的语义。而后续可以查到Filter条件中引用了Correlation Variable的。

创建关联关系的阶段在解析SqlIdentifier时，当此identifier所对应的inputs不为空，并且identifier对应的scope不是parent scope的话namespace就意味着是对某个表的引用，而其他情况就意味着这个表可能还没有toRel，表明是from了一个correlated的item

所以创建了一个 DefferredLookup

LogicalProject(DEPTNO=[$7])

  LogicalFilter(condition=[IN($7, {

LogicalProject(DEPTNO=[$0])

  LogicalFilter(condition=[AND(=($cor0.DEPTNO, $0), =($cor0.DEPTNO, $0))])

    LogicalTableScan(table=[[CATALOG, SALES, DEPT]])

})], variablesSet=[[$cor0]])

    LogicalTableScan(table=[[CATALOG, SALES, EMP]])

convertSelectList

中间还有convert Orderby，convert Aggregate的操作，不过这个样例中没有，最后就是转化selectList，selectList会被转成Project

LogicalProject(EMPNO=[$0], ENAME=[$1], JOB=[$2], MGR=[$3], HIREDATE=[$4], SAL=[$5], COMM=[$6], DEPTNO=[$7], SLACKER=[$8])

  LogicalFilter(condition=[<($0, 10)])

    LogicalTableScan(table=[[CATALOG, SALES, EMP]])

这样通过不断递归convert，完成了SqlNode到RelNode的转化，中间会借助RelBuilder来创建各个RelNode 并通过BlackBoard维护当前的root节点，用于构建整个tree的结构

Calcite sql2rel 过程的更多相关文章

Flink Sql 之 Calcite Volcano优化器（源码解析）
Calcite作为大数据领域最常用的SQL解析引擎,支持Flink , hive, kylin , druid等大型项目的sql解析同时想要深入研究Flink sql源码的话calcite也是必备 ...
[源码分析] 带你梳理 Flink SQL / Table API内部执行流程
[源码分析] 带你梳理 Flink SQL / Table API内部执行流程目录 [源码分析] 带你梳理 Flink SQL / Table API内部执行流程 0x00 摘要 0x01 Apac ...
从"UDF不应有状态" 切入来剖析Flink SQL代码生成
从"UDF不应有状态" 切入来剖析Flink SQL代码生成目录从"UDF不应有状态" 切入来剖析Flink SQL代码生成 0x00 摘要 0x01 概述 ...
[源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码生成 (修订版)
[源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码生成 (修订版) 目录 [源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码 ...
c++ primer plus 第6版部分二 5- 8章
---恢复内容开始--- c++ primer plus 第6版部分二 5- 章第五章计算机除了存储外还可以对数据进行分析.合并.重组.抽取.修改.推断.合成.以及其他操作 1.for ...
calcite介绍
前言 calcite是一个可以将任意数据查询转换成基于sql查询的引擎,引擎特性也有很多,比如支持sql树的解析,udf的扩展,sql执行优化器的扩展等等.目前已经被很多顶级apache项目引用,比如 ...
Flink table&Sql中使用Calcite
Apache Calcite是什么东东 Apache Calcite面向Hadoop新的sql引擎,它提供了标准的SQL语言.多种查询优化和连接各种数据源的能力.除此之外,Calcite还提供了OLA ...
Calcite分析 - Rule
Calcite源码分析,参考: http://matt33.com/2019/03/07/apache-calcite-process-flow/ https://matt33.com/2019/03 ...
春蔚专访--MaxCompute 与 Calcite 的技术和故事
摘要:2019大数据技术公开课第一季<技术人生专访>,来自阿里云计算平台事业部高级开发工程师雷春蔚向大家讲述了MaxCompute 与 Calcite 的技术和故事. 具体内容包括: 1) ...
深入浅出Calcite与SQL CBO（Cost-Based Optimizer）优化
目录 Calcite简介与CBO介绍 Calcite背景与介绍 SQL优化与CBO Calcite优化器 HepPlanner优化器与VolcanoPlanner优化器 Calcite优化样例代码介绍 ...

随机推荐

#双指针#洛谷 7521 [省选联考 2021 B 卷] 取模
题目传送门分析将 \(a\) 排序后从大到小枚举 \(a_k\),注意枚举的时候重复的只考虑一次,那么可以将其它数按照模 \(a_k\) 后排序, 答案只可能来自最大值与次大值之和取模或者之和最接 ...
#欧拉序，线段树#洛谷 6845 [CEOI2019] Dynamic Diameter
题目动态修改边权,强制在线询问树的直径. 分析设 \(dis[x]\) 表示 \(x\) 到1号点的距离. 那么树的直径就可以表示成 \(dis[x]+dis[y]-2*dis[lca]\) 只需 ...
#二分图，并查集#洛谷 6185 [NOI Online #1 提高组] 序列
题目分析考虑2操作可以在保证总和不变的情况下任意修改, 如果将2操作所在的连通块用并查集缩点,那么再考虑1操作, 按照1操作建边,如果存在奇环,那么只要这个环的点权和为偶数一定能使 \(a,b\) ...
#树链剖分，LCA#洛谷 3398 仓鼠找sugar
题目多次询问求树上的两条路径是否有公共点分析有公共点当且仅当一条路径的LCA在另一条路径上, 否则一定会形成一个环,那树剖求LCA判断一下LCA是否在另一条路径上即可代码 #include & ...
基于新版宝塔Docker部署在线客服系统过程小记
我在业余时间开发维护了一款免费开源的升讯威在线客服系统,也收获了许多用户.对我来说,只要能获得用户的认可,就是我最大的动力. 客服系统开发过程中,最让我意外的是对 TCP/IP 协议的认识.过去一直认 ...
Go 语言注释教程
注释是在执行时被忽略的文本.注释可用于解释代码,使其更易读.注释还可用于在测试替代代码时防止代码执行.Go支持单行或多行注释. Go单行注释单行注释以两个正斜杠(//)开头. 在//和行尾之间的任何 ...
Windows wsl2安装Ubuntu
wsl(Windows Subsystem for Linux)即适用于Windows的Linux子系统,是一个实现在Windows 10 / 11上运行原生Linux的技术. wsl2 为其迭代版本 ...
Qt通过UDP发送广播
// x.h QUdpSocket* udp = nullptr; // UDP对象 void createUdpAndSendData(); // 创建UDP对象和发送广播数据 void dropU ...
MogDB学习笔记之 -- 了解pagewriter线程
MogDB 学习笔记之 -- 了解 pagewriter 线程本文出处:https://www.modb.pro/db/183172 在前面的 MogDB 学习系列中,我们了解了核心的 bgwrit ...
MogDB 使用向量化执行引擎进行调优
MogDB 使用向量化执行引擎进行调优本文出处:https://www.modb.pro/db/430318 MogDB 数据库支持行执行引擎和向量化执行引擎,分别对应行存表和列存表. 一次一个 b ...

Calcite sql2rel 过程