Catalyst揭秘 Day4 analyzer解析

哎哟慰 2024-10-28 04:31:36 原文

Catalyst揭秘 Day4

analyzer解析

今天继续解析catalyst，主要讲一下analyzer，在sql语句的处理流程中，analyzer是在sqlparse的基础上，把unresolved logical plan生成logcal plan。

Analyzer定义

在analyzer构造的时候，会传入catalog和functionRegistry，其中catelog用来存放用户指定的表名等信息，functionRegistry存放自定义函数，主要用来将未解析的属性和关系进行转换。

在构造方法中，除了catalog和functionRegistry，还有一个迭代次数，因为在分析时需要不断进行遍历。

通过迭代次数这个参数，我们可以定义一些策略，包括Once和FixedPoint，FixedPoint会根据参数控制迭代次数的上限。

batchs是整个analyzer的核心，里面会定义一系列的rules，这些rules会采取的特定的策略。通过这些规则，会把unresovled变成resovled。

Analyzer指定

RuleExecutor中的execute是执行的入口。
在执行时，我们发现，各个规则之间是串行运行的，首先是对batchs进行循环，再对每个batch中rule进行处理。

标红的这句代码是整个过程的关键，是实际的执行过程，对调用各个Rule中的apply方法。
以一个具体的Rule来看的话，这里会使用到模式匹配，调用resolveOperators方法对plan中的内容进行解析。

resolveOperators会循环遍历各个节点，应用解析规则。

相比于SqlParser，analyzer整个流程更简洁一些，主要就是用rules，采用模式匹配进行处理，在这里还是想再感叹下Scala强大的语法能力。

欲知后事如何，且听下回分解!

DT大数据每天晚上20：00YY频道现场授课频道68917580

Catalyst揭秘 Day4 analyzer解析的更多相关文章

Catalyst揭秘 Day5 optimizer解析
Catalyst揭秘 Day5 optimizer解析 Optimizer是目前为止中catalyst中最重要的部分.主要作用是把analyzed logicalPlan变成optimized Log ...
Catalyst揭秘 Day3 sqlParser解析
Catalyst揭秘 Day3 sqlParser解析今天我们会进入catalyst引擎的第一个模块sqlparser,它是catalyst的前置模块. 树形结构从昨天的介绍我们可以看到sqlPa ...
Catalyst揭秘 Day6 Physical plan解析
Catalyst揭秘 Day6 Physical plan解析物理计划是Spark和Sparksql相对比而言的,因为SparkSql是在Spark core上的一个抽象,物理化就是变成RDD,是S ...
Catalyst揭秘 Day1 Catalyst本地解析
Catalyst揭秘 Day1 Catalyst本地解析今天开始讲下Catalyst,这是我们必须精通的内容之一: 在Spark2.x中,主要会以Dataframe和DataSet为api,无论是D ...
Kakfa揭秘 Day4 Kafka中分区深度解析
Kakfa揭秘 Day4 Kafka中分区深度解析今天主要谈Kafka中的分区数和consumer中的并行度.从使用Kafka的角度说,这些都是至关重要的. 分区原则 Partition代表一个to ...
Catalyst揭秘 Day7 SQL转为RDD的具体实现
Catalyst揭秘 Day7 SQL转为RDD的具体实现从技术角度,越底层和硬件偶尔越高,可动弹的空间越小,而越高层,可动用的智慧是更多.Catalyst就是个高层的智慧. Catalyst已经逐 ...
Catalyst揭秘 Day2 Catalyst源码初探
Catalyst揭秘 Day2 Catalyst源码初探这节课从源码角度来讲catalyst. 首先有一个观点要澄清,就是技术不是越底层就越是性能和效率更高.因为除了指令执行性能以外,更重要的是架构 ...
Catalyst揭秘 Day8 Final 外部数据源和缓存系统
Catalyst揭秘 Day8 Final 外部数据源和缓存系统今天是Catalyst部分的收官,主要讲一些杂项内容. 外部数据源处理什么叫外部数据源,是SparkSql自己支持的一些文件格式,以 ...
Spark Tungsten揭秘 Day4 内存和CPU优化使用
Spark Tungsten揭秘 Day4 内存和CPU优化使用今天聚焦于内存和CPU的优化使用,这是Spark2.0提供的关于执行时的非常大的优化部分. 对过去的代码研究,我们会发现,抽象的提高, ...

随机推荐

数据库字段类型中char和Varchar区别
char和varchar区别 char类型:对英文(ASCII)字符占用1个字节,对一个汉字占用2个字节,char存储定长数据很方便,char字段上的索引效率级高,比如定义char(10),那么不论你 ...
SpringMVC的简单示例
首先导入所需的jar包,项目目录结构如下: 之后需要配置一下web.xml文件,内容如下: <?xml version="1.0" encoding="UTF-8& ...
Android防微信首页左右滑动切换
大家看到微信首页切换效果有没有觉得很炫,滑动切换,点击底部bar瞬间切换,滑动切换渐变效果,线上效果图: 之前也在博客上看到别人的实现,再次基础上,我做了些优化.首先说下实现原理,大神略过,o(╯□╰ ...
[转]IIS7.5 添加expires头提高性能
本文转自:http://niutuku.com/tech/www/271454.shtml 对于页面中不经常变化的静态内容通过指定expires头,来进行浏览器端的缓存,减少每次访问时的请求. 原理: ...
mysql 修改 character_set_database 编码格式
操作系统:win10 x64 Server version : 5.5.46 MySQL Community Server (GPL) mysql 修改 character_set_database ...
Flex性能优化常用手法总结转
转自:http://bbs.51aspx.com/showtopic-43693.html 随着Flex越来越多的被人们所熟知,越来越多的互联网也开始了RIA应用.众所周知,目前国内的宽带应用并不是像 ...
[设计模式]<<设计模式之禅>>关于开闭原则
开闭原则是Java世界里最基础的设计原则,它指导我们如何建立一个稳定的.灵活的系统,先来看开闭原则的定义: Software entities like classes,modules and fun ...
hdu 4614 线段树
思路:当k为1的时候,用二分法查询包含有f个空瓶的上界r,然后更新会方便很多,直接更新区间(a,r)了. #include<iostream> #include<cstdio> ...
关于类型“LinkButton”的控件“xxx”必须放在具有 runat=server 的窗体标记内问题的解决方案
1.首先确认LinkButton控件包含在Form中,检查该Form有无runat标记,如果有,排除Form原因,请继续看. 2.如果看到这里,估计你是在做Excel导出功能.在后台代码中重写Veri ...
详解HTML<head> 头标签元素的意义以及使用场景
HTML<head>头部分的标签.元素有很多,涉及到浏览器对网页的渲染,SEO 等等,而各个浏览器内核以及各个国内浏览器厂商都有些自己的标签元素,这就造成了很多差异性.移动互联网时代,he ...