进公司以来做的都是postgresql相关的东西,每次都是测试.修改边边角角的东西,这样感觉只能留在表面,不能深入了解这个开源数据库的精髓,遂想着看看postgresql的源码,以加深对数据库的理解,也算是好好提高自己. 但是目标很性感,现实很残酷,postgesql的源码都已经百万级了.单单.c文件都有1000+.怎么办,硬着头皮看吧,所幸postgrsql的源码很规范,这应该会给我省不少事.给自己顶一个小目标:每天看一点源码,每天都更新做不到,每周都更新吧,每周至少一篇.希望看到我的博客的朋…
2.可优化语句的执行 可优化语句的共同特点是它们被查询编译器处理后都会生成査询计划树,这一类语句由执行器(Executor)处理.该模块对外提供了三个接口: ExecutorStart.ExecutorRun 和 ExecutorEnd,其输入是包含査询计划树的数据结构QueryDesc,输出则是相关执行信息或结果数据.如果希望执行某个计划树,仅需构造包含此计划树的QueryDesc,并依次调用ExecutorStart.ExecutorRun.ExecutorEnd 3个过程即能完成相应的处理…
接前文跟我一起读postgresql源码(九)--Executor(查询执行模块之--Scan节点(上)) ,本篇把剩下的七个Scan节点结束掉. T_SubqueryScanState, T_FunctionScanState, T_ValuesScanState, T_CteScanState, T_WorkTableScanState, T_ForeignScanState, T_CustomScanState, 8.SubqueryScan 节点 SubqueryScan节点的作用是以另…
从前面介绍的可优化语句处理相关的背景知识.实现思想和执行流程,不难发现可优化语句执行的核心内容是对于各种计划节点的处理,由于使用了节点表示.递归调用.统一接口等设计,计划节点的功能相对独立.代码总体流程相似,下面介绍执行器中各种计划节点的相关执行过程. 在PostgreSQL中,计划节点分为四类,分别是控制节点(Control Node).扫描节点(ScanNode),物化节点(Materialization Node).连接节点(Join Node) . 控制节点:是一类用于处理特殊情况的节点…
上一篇我们介绍了查询规划模块的总体流程和预处理部分的源码.查询规划模块再执行完预处理之后,可以进入正式的查询规划处理流程了. 查询规划的主要工作由grouping_planner函数完成.在具体实现的时候,针对postgresql中独有的继承表,程序使用inheritance_planner函数来解决,该函数主要是先将继承表的继承关系变换为非继承表来处理,然后仍然调用的是grouping_planner函数来完成查询规划的工作. 因此,我们说查询规划的主要工作在于grouping_planner…
上一篇博文我们阅读了postgresql中查询分析模块的源码.查询分析模块对前台送来的命令进行词法分析.语法分析和语义分析后获得对应的查询树(Query).在获得查询树之后,程序开始对查询树进行查询重写处理. 这一篇文章我们进入查询重写模块源码的阅读.还记得上一篇文章的那张函数调用关系图么?不记得没关系,我再放一遍. 上次的查询分析模块走了1~7这些步骤.而查询重写模块即如上图的标记所示,函数pg_rewrite_query是进行查询重写处理的入口函数.该函数定义在src/backend/tco…
接前文,我们继续说剩下的4个Materialization节点. 7.SetOp节点 SetOp节点用于处理集合操作,对应于SQL语句中的EXCEPT.INTERSECT两种集合操作,至于另一种集合操作UNION,可直接由Append节点来实现. 一个SetOp节点只能处理一个集合操作(由两个集合参与),如果有多个集合操作则需要组合多个SetOp节点来实现.SetOp节点仅有一个左子节点作为输人,其左子节点是一个Append节点或者是一个Sort节点(Sort节点的子节点是一个Append节点)…
时间一晃周末就过完了,时间过得太快,不由得让人倍加珍惜.时间真是不够用哈~ 好的不废话,这次我们开始看查询规划模块的源码吧. 查询规划部分的在整个查询处理模块应该是在一个非常重要的地位上,这一步直接决定了查询的方式与路径,很大程度上影响了数据库查询的查询性能.因此这一块代码量也很大,我也会花较多的笔墨来分析这个模块的代码.在篇幅上,可能查询规划这一模块我会用2到3篇文章来细细的说明下.今天这一篇先总体概述下查询规划模块的全貌,在介绍该模块的一个重要的子模块(总共三个主要模块)就结束吧,剩下的交给…
上篇博客简要的介绍了下psql命令行客户端的前台代码.这一次,我们来看看后台的代码吧. 十分不好意思的是,上篇博客我们只说明了前台登陆的代码,没有介绍前台登陆过程中,后台是如何工作的.即:后台接到前台的连接请求后发生了什么?调用了哪些函数?启动了哪些进程? 那么,我们就先讲讲后台的工作流程吧. 1.postgresql后台工作流程 这里首先我们要知道postgresql是典型的"Server/Client"的模式.即服务器后台有一个主进程(postmaster),该进程根据客户端的连接…
1.数据定义语句的执行 数据定义语句(也就是之前我提到的非可优化语句)是一类用于定义数据模式.函数等的功能性语句.不同于元组增删査改的操作,其处理方式是为每一种类型的描述语句调用相应的处理函数. 数据定义语句的执行流程最终会进入到ProcessUtility处理器,然后执行语句对应的不同处理过程.由于数据定义语句的种类很多,因此整个处理过程中的数据结构和方式种类繁冗.复杂,但流程相对简单.固定.这里我们以Create table为例说明数据定义语句的具体处理过程. 1.1数据定义语句执行流程 由…