执行

上一篇讲述了如何通过scala提供的内置DSL支持，实现一个可以解析sql的解析器，这篇讲如何拿到了解析结果-AST以后，如何在数据上进行操作，得到我们想要的结果。之前说到，为什么选择scala作为这个引擎的实现，之一是scala提供了方便的DSL实现支持，其二是因为作为一门函数式编程语言，scala提供了丰富对于集合操作的函数。此外，函数在scala中是一个独立的类型，所以能够把现有的函数进行组合，得到更为强大的函数（和上一篇提到的用解析组合子组合已有的解析器得到更强大的解析器一样）。

首先，我们需要弄清楚普通sql语句的执行顺序，一般来说，sql的书写顺序为

SELECT[DISTINCT]
FROM
WHERE
GROUP BY
HAVING
UNION
ORDER BY

但是，执行顺序为

FROM
WHERE
GROUP BY
HAVING
SELECT
DISTINCT
UNION
ORDER BY

本次实现的sql执行不支持join，所以省去了union部分，但是大致顺序差不多，如果把一个List<Map>想象成一个数据库的表，那么执行顺序可以用下图所示，图中标绿色的箭头表示可以并发执行，聚合函数的执行是不能并发的，但是因为已经把数据给分组了，故可以在更高的一个层次并发。

了解了大致的执行流程，下面说一下各个流程执行所用到的函数。

where子句
where子句的执行，利用了 filter函数，将不符合条件的数据给过滤掉。举个例子，下面这个段代码，将列表中的奇数给过滤掉。
```
scala> val L = List(1,2,3,4,5,6)

L: List[Int] = List(1, 2, 3, 4, 5, 6)

scala> L filter(_%2==0)

res2: List[Int] = List(2, 4, 6)
```
对每个元素进行判断这个步骤其实是可以并发执行的，你只需要这样写，就能进行安全的并发操作。
```
scala> L.par.filter(_%2==0).toList

res4: List[Int] = List(2, 4, 6)
```
在scala_sql引擎中，实现where的函数为
```
def where(where: Option[SqlExpr]): Table = {

      where match {

        case None => table

        case Some(x: SqlExpr) => table filter (evalWhereEachRow(_, x))

      }

    }
```
其中evalWhereEachRow(_,x)是另外一个函数，第一个参数是table中的一列，即一个Map对象，第二个参数是由sql解析得到的AST中，对应where子句的部分。

groupBy子句
scala中也提供了对于集合的groupBy操作，接着上个例子

scala> L groupBy(_%2)

res6: scala.collection.immutable.Map[Int,List[Int]] = Map(1 -> List(1, 3, 5), 0 -> List(2, 4, 6))

上面这个函数，把L这个list根据奇偶分组。
在scala _sql引擎中，实现groupBy的函数为

 def evalGroupBy(table: Table, groupby: SqlGroupBy): Seq[Table] = {

    val keys: Seq[String] = groupby.keys map {

      case x: FieldIdent => x.name

    }

    table.groupBy(row => keys.map(row(_))).map(_._2).toSeq

  }

结论

DSL主要有两种，内部DSL和外部DSL，对于外部DSL，需要一个解析器来解析DSL的脚本，得到能够让程序处理的数据结构，这种数据结构通常是一种AST。实现需要的解析器，大体有两种方式：

手工写一个，例如druid中的sql解析模块。
利用ANTRL等解析生成器，通过编写语法规则，生成一个解析器。

近年来随着函数式编程慢慢得到工业界的关注，利用parser combinator(解析组合子)的方式来编写解析器实现DSL也进入了大众视野。

用scala实现一个sql执行引擎-(下)的更多相关文章

用scala实现一个sql执行引擎-(上)
前言在实时计算中,通常是从队列中收集原始数据,这种原始数据在内存中通常是一个java bean,把数据收集过来以后,通常会把数据落地到数据库,供后面的ETL使用.举个一个简单的例子,对一个游戏来说, ...
自己实现一个SQL解析引擎
自己实现一个SQL解析引擎功能:将用户输入的SQL语句序列转换为一个可运行的操作序列,并返回查询的结果集. SQL的解析引擎包含查询编译与查询优化和查询的执行,主要包含3个步骤: 查询分析: 制定逻 ...
自己动手写SQL执行引擎
自己动手写SQL执行引擎前言在阅读了大量关于数据库的资料后,笔者情不自禁产生了一个造数据库轮子的想法.来验证一下自己对于数据库底层原理的掌握是否牢靠.在笔者的github中给这个database起 ...
给隔壁的妹子讲『一个SQL语句是如何执行的？』
前言 SQL作为Web开发是永远离开不的一个话题,天天写SQL,可是你知道一个SQL是如何执行的吗? select name from user where id = 1; 上面是一个简单的查询语句, ...
Oracle数据库该如何着手优化一个SQL
这是个终极问题,因为优化本身的复杂性实在是难以总结的,很多时候优化的方法并不是用到了什么高深莫测的技术,而只是一个思想意识层面的差异,而这些都很可能连带导致性能表现上的巨大差异. 所以有时候我们应该先 ...
SQL执行过程中的性能负载点
一.SQL执行过程 1.用户连接数据库,执行SQL语句: 2.先在内存进行内存读,找到了所需数据就直接交给用户工作空间: 3.内存读失败,也就说在内存中没找到支持SQL所需数据,就进行物理读,也就是到 ...
spark sql 执行计划生成案例
前言一个SQL从词法解析.语法解析.逻辑执行计划.物理执行计划最终转换为可以执行的RDD,中间经历了很多的步骤和流程.其中词法分析和语法分析均有ANTLR4完成,可以进一步学习ANTLR4的相关知识 ...
hint不当索引，影响多表连接方式，最终导致SQL执行缓慢
需求:一个SQL执行特别慢,无法返回结果,需要进行优化,最终返回结果即可. 一.SQL分析二.尝试执行,观测执行计划三.修改SQL 四.问题总结一.SQL分析 )SQL文本,执行时间,执行用户 ...
spring 默认情况下事务是惟一的同一个方法里面第一个sql开启后在执行完将事务传递给下一个sql
spring 默认情况下事务是惟一的同一个方法里面第一个sql开启后在执行完将事务传递给下一个sql

随机推荐

web_reg_find()函数的使用
1.此函数的作用,很显然就是能告之测试人员页面是否显示正确,其意义与价值在我此次支撑平台的性能测试得到了体现. 2.在使用此函数的过程中,遇到了非常郁闷的事情,幸得老大的帮助才得以跳出误区.当在此函数 ...
洛谷P3373 【模板】线段树 2
P3373 [模板]线段树 2 47通过 186提交题目提供者HansBug 标签难度提高+/省选- 提交讨论题解最新讨论为啥WA(TAT) 题目描述如题,已知一个数列,你需要进行 ...
Asp.net 怎样去除表单多行文本框滚动条
<textarea style="overflow:hidden;border-width:0px;">永远没有滚动条</textarea><text ...
HTML实体字符转化为HTML标签
html_entity_decode方法参数描述 string 必需.规定要解码的字符串. flags 可选.规定如何处理引号以及使用哪种文档类型. 可用的引号类型: ENT_COMPAT - 默 ...
tomcat的乱码问题
String filename=request.getParameter("filename"); filename=new String(filename.getBytes(&q ...
projecteuler 10001st prime (求出第10001个质数)
By listing the first six prime numbers: 2, 3, 5, 7, 11, and 13, we can see that the 6th prime is 13. ...
js节点属性
在文档对象模型 (DOM) 中,每个节点都是一个对象.DOM 节点有三个重要的属性 : 1. nodeName : 节点的名称 2. nodeValue :节点的值 3. nodeType :节点的类 ...
B-F 字符串匹配算法
Brute-Froce 算法是串的匹配模式算法中的一种其匹配方式如下: 1.设有字符串 a ,b;a为主串,在 a 中查找 b 串的位置 2.匹配方式如下: 2.1: 分别从 a,b串的第一个元素开始 ...
js判断是否安装pdf播放器
function isPDFPluginInstall() { if (!isIE()) { //ie 浏览器和非ie浏览器支持 // not ie if (navigator.plugins & ...
Android_ADB 常用 shell命令和 sqlite3 简单增删改查
今天学习了一个ADB的常用命令.接下来简单使用几个常用ADB shell 命令. 首先我们得明白什么是adb.exe ADB -Android Debug Bridge, 是 Android sdk ...

用scala实现一个sql执行引擎-(下)

执行

结论

用scala实现一个sql执行引擎-(下)的更多相关文章

随机推荐

热门专题