一、ShardingContext

在Sharding-Jdbc中，我们其实需要抓住一个核心类，也就是ShardingContext，分片上下文，里面定义了下面几个内容：

@RequiredArgsConstructor

@Getter

public final class ShardingContext {

    //分片规则

    private final ShardingRule shardingRule;

    //数据库类型

    private final DatabaseType databaseType;

    //执行引擎

    private final ExecutorEngine executorEngine;

    //是否要在log文件中展示sql语句

    private final boolean showSQL;

}

里面的几个参数很简单易懂，但是里面包含的内容也是整个中间件的核心内容。

二、preparedStatement

这块对应于代码中的jdbc/core/statement，里面包括两部分，一部分是statement，一部分是prepareStatement。考虑到性能问题（prepareStatement可以进行缓存）和代码的优雅性（变量的设置），以及考虑到通常JDBC使用的都是prepareStatement，所以我们着重看下prepareStatement的两部分，即MasterSlavePreparedStatement和ShardingPreparedStatement。

2.1 MasterSlavePreparedStatement

2.1.1 获取connection

支持读写分离。这块可以先看一些他的构造方法，构造方法中一般都有这样的方法：

connection.getConnections(sqlStatement.getType())

这块其实是根据sql的类型，来获取不同的连接

如果是DDL类型，会获取所有的连接，包括master和slave，也就是说对于表结构的修改，会修改包括master和slave
如果是DML类型，也就是写操作，获取的是master的连接
最后，如果是DQL类型，也就是读操作，是根据读写分离的策略获取某个slave连接

后面两种是有本地缓存的，可以避免每次都进行connect构建，提高效率。

当然，这个sqlType是怎么来的？这就需要用到sql解析的模块了。

SQLStatement sqlStatement = new SQLJudgeEngine(sql).judge();

这块先提一下，后续再详细讲解。

2.1.2 执行sql

主要有三个方法，

executeQuery

public ResultSet executeQuery() throws SQLException {

    Preconditions.checkArgument(1 == routedStatements.size(), "Cannot support executeQuery for DDL");

    return routedStatements.iterator().next().executeQuery();

}

首先说明下，这里的routedStatements是待执行sql的一个集合，这块首先确保只有一个查询语句。然后直接调用PreparedStatement.executeQuery()方法，比较直观。

executeUpdate

public int executeUpdate() throws SQLException {

    int result = 0;

    for (PreparedStatement each : routedStatements) {

        result += each.executeUpdate();

    }

    return result;

}

这块逻辑与上面一致，不过不一样的是，可以传入多个update的语句，然后顺序执行，最后调用的是PreparedStatement.executeUpdate()方法。

execute

public boolean execute() throws SQLException {

    boolean result = false;

    for (PreparedStatement each : routedStatements) {

        result = each.execute();

    }

    return result;

}

最后就是一些其他的方法的执行了。

总的来说，读写分离这块的内容比较简单，首先sql语句不要怎么变化，再者数据库连接connection基本上都是确定的，所以不需要路由什么的，可以直接运行。

2.2 ShardingPreparedStatement

下面我们看下分库分表的情况下，来执行我们的sql，这块就稍微有些复杂了。

2.2.1 构造方法

首先看一下他的构造方法，构造方法中有一些很奇怪的常量，比如TYPE_FORWARD_ONLY、CONCUR_READ_ONLY等等，这块可以参考这篇博客。其实就是在读写过程中的指针的方向等内容。

2.2.2 sql执行

2.2.2.1 查询

查询的逻辑大概如下：

sql路由
sql改写
sql执行
结果合并

下面看下代码：

public ResultSet executeQuery() throws SQLException {

    ResultSet result;

    try {

        Collection<PreparedStatementUnit> preparedStatementUnits = route();

        List<ResultSet> resultSets = new PreparedStatementExecutor(

                getConnection().getShardingContext().getExecutorEngine(), routeResult.getSqlStatement().getType(), preparedStatementUnits, getParameters()).executeQuery();

        result = new ShardingResultSet(resultSets, new MergeEngine(resultSets, (SelectStatement) routeResult.getSqlStatement()).merge());

    } finally {

        clearBatch();

    }

    currentResultSet = result;

    return result;

}

首先我们需要看几个类：

PreparedStatementUnit
- SQLExecutionUnit：包括dataSource和sql
- PreparedStatement

这个类，会用于最终我们到具体的数据库上执行sql，调用route方法，其实就是路由到具体的服务器上面。

private Collection<PreparedStatementUnit> route() throws SQLException {

    Collection<PreparedStatementUnit> result = new LinkedList<>();

    routeResult = routingEngine.route(getParameters());

    for (SQLExecutionUnit each : routeResult.getExecutionUnits()) {

        SQLType sqlType = routeResult.getSqlStatement().getType();

        Collection<PreparedStatement> preparedStatements;

        if (SQLType.DDL == sqlType) {

            preparedStatements = generatePreparedStatementForDDL(each);

        } else {

            preparedStatements = Collections.singletonList(generatePreparedStatement(each));

        }

        routedStatements.addAll(preparedStatements);

        for (PreparedStatement preparedStatement : preparedStatements) {

            replaySetParameter(preparedStatement);

            result.add(new PreparedStatementUnit(each, preparedStatement));

        }

    }

    return result;

}

这里面有个routeResult，其实就是根据入参路由到的数据库列表。这边有一个路由引擎，看下这边是怎么路由的：

public SQLRouteResult route(final List<Object> parameters) {

    if (null == sqlStatement) {

        sqlStatement = sqlRouter.parse(logicSQL, parameters.size());

    }

    return sqlRouter.route(logicSQL, parameters, sqlStatement);

}

这边有几个参数，

logicSQL：表示逻辑上的sql，因为业务使用时，写的sql其实是逻辑上的sql，用到的数据库和表也是逻辑库和逻辑表
parameters：传入的参数
sqlStatement：最终的sql语句

首先解析sql，然后路由。这边的解析还是老套路，但是如果解析出来的sql是insert，而且配置了自动生成key，那么会调用自动生成key的方法，生成key，放到对应的column下。解析这块后续再分析。下面我们看下路由：

@Override

public SQLRouteResult route(final String logicSQL, final List<Object> parameters, final SQLStatement sqlStatement) {

    SQLRouteResult result = new SQLRouteResult(sqlStatement);

    if (sqlStatement instanceof InsertStatement && null != ((InsertStatement) sqlStatement).getGeneratedKey()) {

        processGeneratedKey(parameters, (InsertStatement) sqlStatement, result);

    }

    //路由

    RoutingResult routingResult = route(parameters, sqlStatement);

    //重写sql

    SQLRewriteEngine rewriteEngine = new SQLRewriteEngine(shardingRule, logicSQL, databaseType, sqlStatement);

    boolean isSingleRouting = routingResult.isSingleRouting();

    if (sqlStatement instanceof SelectStatement && null != ((SelectStatement) sqlStatement).getLimit()) {

        processLimit(parameters, (SelectStatement) sqlStatement, isSingleRouting);

    }

    SQLBuilder sqlBuilder = rewriteEngine.rewrite(!isSingleRouting);

    if (routingResult instanceof CartesianRoutingResult) {

        for (CartesianDataSource cartesianDataSource : ((CartesianRoutingResult) routingResult).getRoutingDataSources()) {

            for (CartesianTableReference cartesianTableReference : cartesianDataSource.getRoutingTableReferences()) {

                result.getExecutionUnits().add(new SQLExecutionUnit(cartesianDataSource.getDataSource(), rewriteEngine.generateSQL(cartesianTableReference, sqlBuilder)));

            }

        }

    } else {

        for (TableUnit each : routingResult.getTableUnits().getTableUnits()) {

            result.getExecutionUnits().add(new SQLExecutionUnit(each.getDataSourceName(), rewriteEngine.generateSQL(each, sqlBuilder)));

        }

    }

    if (showSQL) {

        SQLLogger.logSQL(logicSQL, sqlStatement, result.getExecutionUnits(), parameters);

    }

    return result;

}

先看路由：

private RoutingResult route(final List<Object> parameters, final SQLStatement sqlStatement) {

    Collection<String> tableNames = sqlStatement.getTables().getTableNames();

    RoutingEngine routingEngine;

    //不涉及到具体的表，全路由

    if (tableNames.isEmpty()) {

        routingEngine = new DatabaseAllRoutingEngine(shardingRule.getDataSourceMap());

    } else if (1 == tableNames.size() || shardingRule.isAllBindingTables(tableNames) || shardingRule.isAllInDefaultDataSource(tableNames)) {

        routingEngine = new SimpleRoutingEngine(shardingRule, parameters, tableNames.iterator().next(), sqlStatement);

    } else {

        // TODO config for cartesian set

        routingEngine = new ComplexRoutingEngine(shardingRule, parameters, tableNames, sqlStatement);

    }

    return routingEngine.route();

}

这里涉及到一个bindingTable的概念，概念如下：指在任何场景下分片规则均一致的主表和子表。例：订单表和订单项表，均按照订单ID分片，则此两张表互为BindingTable关系。BindingTable关系的多表关联查询不会出现笛卡尔积关联，关联查询效率将大大提升。

这里最终返回的结果RoutingResult类似如下：

这里面有几种路由类，后续再详细分析。

获取到数据库表的路由信息后，就到了sql改写的过程。这里也有一个sql改写的引擎：++SQLRewriteEngine++。中间插入了一个判断，routingResult.isSingleRouting()，判断是否路由之后的DB只有一个。这里有个小的优化：如果是select语句，用到了limit，而且最终落到了单片上，那么sql语句是不会被重写的，通过rewrite方法也可以看出来，是和isSingleRouting取反的。

public SQLBuilder rewrite(final boolean isRewriteLimit) {

    SQLBuilder result = new SQLBuilder();

    if (sqlTokens.isEmpty()) {

        result.appendLiterals(originalSQL);

        return result;

    }

    int count = 0;

    sortByBeginPosition();

    for (SQLToken each : sqlTokens) {

        if (0 == count) {

            result.appendLiterals(originalSQL.substring(0, each.getBeginPosition()));

        }

        if (each instanceof TableToken) {

            appendTableToken(result, (TableToken) each, count, sqlTokens);

        } else if (each instanceof ItemsToken) {

            appendItemsToken(result, (ItemsToken) each, count, sqlTokens);

        } else if (each instanceof RowCountToken) {

            appendLimitRowCount(result, (RowCountToken) each, count, sqlTokens, isRewriteLimit);

        } else if (each instanceof OffsetToken) {

            appendLimitOffsetToken(result, (OffsetToken) each, count, sqlTokens, isRewriteLimit);

        } else if (each instanceof OrderByToken) {

            appendOrderByToken(result, count, sqlTokens);

        }

        count++;

    }

    return result;

}

执行完成这步之后，sql语句重写基本完成。如果路由结果涉及到笛卡尔积，还需要对sql进行进一步的重写，因为涉及到关联表。下面涉及到真正转化sql这部分，使用的方法是：rewriteEngine.generateSQL，涉及到sql中的逻辑库表替换为实际的库表，形成SQLExecutionUnit，添加到待执行的sql列表中，最终得到SQLRouteResult。至此，sql路由完成。回到ShardingPreparedStatement的route方法。遍历routeResult，形成预执行的statement集合。

再回到ShardingPreparedStatement的executeQuery()方法，route()得到了Collection，下面就到了真正要执行sql的步骤。

【源码解析】Sharding-Jdbc的执行过程（一）的更多相关文章

Flink 源码解析 —— JobManager 处理 SubmitJob 的过程
JobManager 处理 SubmitJob https://t.zsxq.com/3JQJMzZ 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0到1 ...
Flink 源码解析 —— TaskManager 处理 SubmitJob 的过程
TaskManager 处理 SubmitJob 的过程 https://t.zsxq.com/eu7mQZj 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink ...
Netty 源码解析（九）: connect 过程和 bind 过程分析
原创申明:本文由公众号[猿灯塔]原创,转载请说明出处标注今天是猿灯塔“365篇原创计划”第九篇. 接下来的时间灯塔君持续更新Netty系列一共九篇 Netty 源码解析(一): 开始 Netty 源 ...
Mybatis源码解析1—— JDBC
在之前的文章中,我为大家介绍了 Mybatis 的详细用法,算是基础教程. 详细链接:Mybatis 基础教程言归正传,只懂基础可不行,接下来将给大家带来高阶的源码解析教程,从浅入深,通过源码解析, ...
Fabric1.4源码解析：客户端创建通道过程
在使用Fabric创建通道的时候,通常我们执行一条命令完成,这篇文章就解析一下执行这条命令后Fabric源码中执行的流程. peer channel create -o orderer.example ...
Netty源码解析 -- ChannelPipeline机制与读写过程
本文继续阅读Netty源码,解析ChannelPipeline事件传播原理,以及Netty读写过程. 源码分析基于Netty 4.1 ChannelPipeline Netty中的ChannelPip ...
Netty源码解析 -- ChannelOutboundBuffer实现与Flush过程
前面文章说了,ChannelHandlerContext#write只是将数据缓存到ChannelOutboundBuffer,等到ChannelHandlerContext#flush时,再将Cha ...
【转】aiohttp 源码解析之 request 的处理过程
[转自太阳尚远的博客:http://blog.yeqianfeng.me/2016/04/01/python-yield-expression/] 使用过 python 的 aiohttp 第三方库 ...
MyBatis源码解析（一）——执行流程
原创作品,可以转载,但是请标注出处地址:http://www.cnblogs.com/V1haoge/p/6603926.html 一.MyBatis简介 MyBatis框架是一种轻量级的ORM框架, ...

随机推荐

超精简易用cocoaPods的安装和使用
cocoaPods 安装和使用第一步:替换ruby源 $ gem sources -l 查看当前ruby的源 $ gem sources ...
Eclipse 3.5 以后安装插件很慢的解决办法
1 .除非你需要,否则不要选择"联接到所有更新站点" 在安装对话框里有一个小复选框,其标示为"在安装过程中联接到所有更新站点从而找到所需的软件."从表面上看,这 ...
access窗体最大化到软件大小
Private Sub Form_Load()DoCmd.ShowToolbar "Ribbon", acToolbarNo '窗体最大化,占满软件最 End Sub
C++神奇算法库——#include<algorithm>
算法(Algorithm)为一个计算的具体步骤,常用于计算.数据处理和自动推理.C++ 算法库(Algorithms library)为 C++ 程序提供了大量可以用来对容器及其它序列进行算法操作的函 ...
Navicat永久激活步骤,激活工具,解决注册码无效的问题
Navicat for MySQL是一套管理和开发MySQL或MariaDB的理想解决方案,支持单一程序,可同时连接到MySQL和MariaDB.这个功能齐备的前端软件为数据库管理.开发和维护提供了直 ...
arcengine之版本管理
public void VersionManagement(IVersionedWorkspace versionedWorkspace) { //creating the new version o ...
C#高级编程笔记之第二章：核心C#
变量的初始化和作用域 C#的预定义数据类型流控制枚举名称空间预处理命令 C#编程的推荐规则和约定变量的初始化和作用域初始化 C#有两个方法可以一确保变量在使用前进行了初始化: 变量是字段, ...
Django rest framework（6）----序列化
目录 Django rest framework(1)----认证 Django rest framework(2)----权限 Django rest framework(3)----节流 Djan ...
Python_heapq
import heapq #导入heapq堆模块 import random data = random.sample(range(1000),10) print(data) heapq.heapif ...
DX11 Without DirectX SDK--使用Windows SDK来进行开发
在看龙书(Introduction to 3D Game Programming with Directx 11)的时候,里面所使用的开发工具包为Microsoft DirectX SDK(June ...

【源码解析】Sharding-Jdbc的执行过程（一）