1 背景

研究mybatis-plus(以下简称MBP),使用其分页功能时。发现了一个JsqlParserCountOptimize的分页优化处理类,官方对其未做详细介绍,网上也未找到分析该类逻辑的只言片语,这情况咱也不敢用呀,索性深度剖析一下,也方便他人。

2 原理

首先PaginationInterceptor分页拦截器的原理这里不累述(mybatis通用分页封装的实现原理挺简单的,也就那么回事),最终落实到查询上基本是分为2个sql:查count总记录数 + 查真实分页记录。而此类是用优化来其中的查count这步。这count查询要怎么优化?这里上真实场景帮助大家理解: 假如有2张表user、user_address、user_account分别记录用户和用户地址和用户账户,1个用户可能有多个地址即1对多关系;1个用户只能有1个账户即1对1关系。

2.1 优化order by

先看下面的sql,放到分页查询下

  1. select * from user order by age desc, update_time desc

传统分页组件往往是

  1. count:
  2. select count(1) from (select * from user order by age desc, update_time desc)
  3. 查记录:
  4. select * from user order by age desc, update_time desc limit 0,50

发现问题了吗?查count时的order by是完全可以去掉的!在复杂查询、大表、非索引字段排序等情况下查记录已经很慢了,查count又要来一次!所以查count显然希望优化为select count(1) from (select * from user)

2.1.1 限制

但是也不是所有场景都可以优化的,比如带group by的查询

2.1.2 源码

所以MBP源码如下实现,没有group by且有order by的语句,就把order by去掉

  1. // 添加包含groupBy 不去除orderBy
  2. if (null == groupBy && CollectionUtils.isNotEmpty(orderBy)) {
  3. plainSelect.setOrderByElements(null);
  4. sqlInfo.setOrderBy(false);
  5. }

2.2 优化join场景

在join操作时,也存在优化可能,看下面sql

  1. select u.id,ua.account from user u left join user_account ua on u.id=ua.uid

这时候分页查count时,其实可以去掉left join直查user,因为user与user_account是1对1关系,如下

  1. count:
  2. select count(1) from user u
  3. 查记录:
  4. select u.id,ua.account from user u left join user_account ua on u.id=ua.uid limit 0,50

2.2.1 限制

查count能否去掉join直查首表,还存在诸多限制,如下:

表记录join后不能放大记录数

从上面案例可知,如果left join后记录数对比直查首表的总记录数会放大,就不能进行这个优化。比如3个用户每人各记录2条地址

  1. select u.id,ua.address from user u left join user_address ua on u.id=ua.uid 6条)
  2. vs
  3. select count(1) from user u 3条)

此时去掉left join去查count就会得到更少的总记录数。注意这可能会变成一个坑,MBP无法自动判断本次分页查询是否会进行记录放大,所以join优化默认是关闭的,如果想开启需要声明自定义的JsqlParserCountOptimize bean,并设置optimizeJoin为true,如下

  1. @Bean
  2. public PaginationInterceptor paginationInterceptor() {
  3. PaginationInterceptor paginationInterceptor = new PaginationInterceptor();
  4. paginationInterceptor.setCountSqlParser(new JsqlParserCountOptimize(true));
  5. return paginationInterceptor;
  6. }

其实这里源码设计有些不合理,因为开了之后就得小心翼翼的审查自己各类left join的分页代码了,如果有放大的话,只能构造Page对象时,设置optimizeCountSql为false(默认true),相当于关闭本次查询所有count优化,那么不光是join,包括order by等优化也都不进行了。建议可以改为从Page(或ThreadLocal?)中获取optimizeJoin,变为每次查询级别可配的配置,默认关,而经过开发人员确认可join优化的才主动在本次查询级别设置开启。

仅限left join

如果是inner join或right join往往都会放大记录数,所以MBP优化会自动判断如果多个join里出现任何非left join的,就不进行此优化,比如from a left join b .... right join c... left join d此时会直接不进行优化

on语句有查询条件

比如

  1. select u.id,ua.account from user u left join user_account ua on u.id=ua.uid and ua.account > ?

where语句包含连接表的条件

比如

  1. select u.id,ua.account from user u left join user_account ua on u.id=ua.uid where ua.account > ?

2.2.2 源码

MBP的join优化源码大致如下,对应上面的优化和限制

  1. List<Join> joins = plainSelect.getJoins();
  2. // 是否全局开启了optimizeJoin(这里建议还可以从Page中按每次查询设置)
  3. if (optimizeJoin && CollectionUtils.isNotEmpty(joins)) {
  4. boolean canRemoveJoin = true;
  5. String whereS = Optional.ofNullable(plainSelect.getWhere()).map(Expression::toString).orElse(StringPool.EMPTY);
  6. for (Join join : joins) {
  7. // 仅限left join
  8. if (!join.isLeft()) {
  9. canRemoveJoin = false;
  10. break;
  11. }
  12. Table table = (Table) join.getRightItem();
  13. String str = Optional.ofNullable(table.getAlias()).map(Alias::getName).orElse(table.getName()) + StringPool.DOT;
  14. String onExpressionS = join.getOnExpression().toString();
  15. /* 如果 join 里包含 ?(代表on语句有查询条件)
  16. 或者
  17. where语句包含连接表的条件
  18. 就不移除 join */
  19. if (onExpressionS.contains(StringPool.QUESTION_MARK) || whereS.contains(str)) {
  20. canRemoveJoin = false;
  21. break;
  22. }
  23. }
  24. if (canRemoveJoin) {
  25. plainSelect.setJoins(null);
  26. }
  27. }

2.3 优化select count(1)位置

传统的分页,往往是在原始查询sql的外层套select count(1),比如

  1. select count(1) from (select * from user)

而count真实目的是得到记录数,完全不需要原始查询里的select *产生额外耗时,所以可以优化为如下语句

  1. select count(1) from user

2.3.1 限制

同样的,有一些场景不能进行count位置优化

select的字段里包含参数

如果select中包含#{}、${}等待替换的参数,也不能进行此优化,因为后续占位符替换真实值阶段会由于占位符个数减少导致报错,比如

  1. select count(1) from (select power(#{aSelectParam},2) from user_account where uid=#{uidParam}) ua
  2. vs
  3. select count(1) from user_account where uid=#{uidParam} ua

MBP官方issue#95登记了此问题

包含distinct

select中包含distinct去重的语句,若去除有可能导致count记录数增大,所以不能进行此优化。比如

  1. select count(1) from (select distinct(uid) from user_address) ua
  2. vs
  3. select count(1) from user_address ua #记录数可能增大

包含group by

包含group by的语句,由于select中往往会有聚合函数,所以count(1)内置语义变成了聚合函数,不能进行此优化。比如

  1. select count(1) from (select uid,count(1) from user_address group by uid) ua #返回单行单列总记录数
  2. vs
  3. select count(1) from user_address group by uid #返回多行单列聚合count数

2.3.2 源码

MBP中相关源码如下

  1. //select的字段里包含参数不优化
  2. for (SelectItem item : plainSelect.getSelectItems()) {
  3. if (item.toString().contains(StringPool.QUESTION_MARK)) {
  4. return sqlInfo.setSql(SqlParserUtils.getOriginalCountSql(selectStatement.toString()));
  5. }
  6. }
  7. // 包含 distinct、groupBy不优化
  8. if (distinct != null || null != groupBy) {
  9. return sqlInfo.setSql(SqlParserUtils.getOriginalCountSql(selectStatement.toString()));
  10. }
  11. ...
  12. // 优化 SQL,COUNT_SELECT_ITEM其实就是select count(1)语句
  13. plainSelect.setSelectItems(COUNT_SELECT_ITEM);

3 总结

本文其实是针对通用分页组件中,对查count记录数这一步骤的一些优化思路,回顾一下:

  • 优化order by
  • 优化join语句
  • 优化select count(1)位置
  • 注意以上优化对应的限制,否则可能导致业务错误(特别是join优化,比较隐藏)

其实并不局限于MBP,大家自定义的分页拦截器也可以尝试用上,对分页时的优化还是效果显著的

“用来记录生命的演进,故事的迭代。期望做一个给大家带来帮助和思考的平台” ——深邃老夏

详解分页组件中查count总记录优化的更多相关文章

  1. 详解angular2组件中的变化检测机制(对比angular1的脏检测)

    组件和变化检测器 如你所知,Angular 2 应用程序是一颗组件树,而每个组件都有自己的变化检测器,这意味着应用程序也是一颗变化检测器树.顺便说一句,你可能会想.是由谁来生成变化检测器?这是个好问题 ...

  2. Unity Jobsystem 详解实体组件系统ECS

    原文摘选自Unity Jobsystem 详解实体组件系统ECS 简介 随着ECS的加入,Unity基本上改变了软件开发方面的大部分方法.ECS的加入预示着OOP方法的结束.随着实体组件系统ECS的到 ...

  3. [转]详解C#组件开发的来龙去脉

    C#组件开发首先要了解组件的功能,以及组件为什么会存在.在Visual Studio .NET环境下,将会有新形式的C#组件开发. 组件的功能 微软即将发布的 Visual Studio .NET 将 ...

  4. Angular6 学习笔记——组件详解之组件通讯

    angular6.x系列的学习笔记记录,仍在不断完善中,学习地址: https://www.angular.cn/guide/template-syntax http://www.ngfans.net ...

  5. zz详解深度学习中的Normalization,BN/LN/WN

    详解深度学习中的Normalization,BN/LN/WN 讲得是相当之透彻清晰了 深度神经网络模型训练之难众所周知,其中一个重要的现象就是 Internal Covariate Shift. Ba ...

  6. 详解 $_SERVER 函数中QUERY_STRING和REQUEST_URI区别

    详解 $_SERVER 函数中QUERY_STRING和REQUEST_URI区别 http://blog.sina.com.cn/s/blog_686999de0100jgda.html   实例: ...

  7. 详解 Go 语言中的 time.Duration 类型

    swardsman详解 Go 语言中的 time.Duration 类型swardsman · 2018-03-17 23:10:54 · 5448 次点击 · 预计阅读时间 5 分钟 · 31分钟之 ...

  8. 详解jquery插件中(function ( $, window, document, undefined )的作用。

    1.(function(window,undefined){})(window); Q:(function(window,undefined){})(window);中为什么要将window和unde ...

  9. [转载]详解网络传输中的三张表,MAC地址表、ARP缓存表以及路由表

    [转载]详解网络传输中的三张表,MAC地址表.ARP缓存表以及路由表 虽然学过了计算机网络,但是这部分还是有点乱.正好在网上看到了一篇文章,讲的很透彻,转载过来康康. 本文出自 "邓奇的Bl ...

随机推荐

  1. mysqli存储过程

    <?php$link = mysqli_connect('localhost','root','','chinatupai');  $sql = "call getEmail('000 ...

  2. FPGA 浮点定点数的处理

    大纲: 1浮点数的格式指定 2浮点数的运算(加法) 3浮点数加减法器的实现(难于乘除法器的实现)  1. 在FPGA的设计中,浮点数的概念不同于C语言中的定义,这里的浮点数指的是小数点位置会发生变化的 ...

  3. when|nobody|hazard|lane|circuit|

    How can I help them  they won't listen to me? 题目解析 考查从句.此句意为:如果他们要是不听我的话,我怎么帮助他们?此处,when引导的状语从句表示假设事 ...

  4. python读取配置文件报keyerror-文件路径不正确导致的错误

    - 在其他模块使用反射读取配置文件报错,但是在反射模块中读取GetData.check_list又是正确的 反射模块如下: # get_data.py from API_AUTO.p2p_projec ...

  5. com.mysql.jdbc.exceptions.jdbc4.MySQLDataException: '2.34435678977654336E17' in column '3' is outside valid range for the datatype INTEGER.

    ### Error querying database. Cause: java.lang.reflect.UndeclaredThrowableException### The error may ...

  6. mac 下openOffice服务的安装

    1.安装准备 安装 Homebrew 及 Homebrew-Cask Homebrew 是一个Mac上的包管理工具.使用Homebrew可以很轻松的安装缺少的依赖. Homebrew-Cask是建立在 ...

  7. 前端自动化构建工具gulp

    1.gulp的安装 首先确保你已经正确安装了nodejs环境.然后以全局方式安装gulp: npm install -g gulp 全局安装gulp后,还需要在每个要使用gulp的项目中都单独安装一次 ...

  8. Book. Effective C++ item2-尽量使用const, enum, inline替换#define

    ##常规变量 c++里面的#define后面的定义部分,是不算代码的一部分的.所以如果你使用#define: #define ASPECT_RATIO 1.653 你希望这个代号ASPECT RATI ...

  9. e代驾狂野裁员 O2O逐渐恢复理智?

    O2O逐渐恢复理智?" title="e代驾狂野裁员 O2O逐渐恢复理智?">     近段时间以来,O2O行业堪称"哀鸿遍野",十分凄惨.巨头 ...

  10. 作为前端,你需要懂得javascript实现继承的方法

    在ES6之前,javascript不跟其他语言一样,有直接继承的方法,它需要借助于构造函数+原型对象模拟实现继承.现在我们可以利用ES6的extends方法实现继承,如果想了解更多有关ES6实现的继承 ...