神奇的 SQL 之 CASE表达式,妙用多多 !
前言
历史考试选择题:黄花岗起义第一枪谁开的? A宋教仁 B孙中山 C黄兴 D徐锡麟,考生选C。
又看第二题:黄花岗起义第二枪谁开的? 考生傻了,就选了个B。
接着看第三题:黄花岗起义中,第三枪谁开的? 考生疯了,胡乱选了A。
考试出来就去找出卷老师。老师拿出课本说:黄兴连开三枪,揭开了黄花岗起义的序幕。考生:......
CASE表达式 之概念
相信大家都用过CASE表达式,尤其是做一些统计功能的时候,用的特别多,可真要说什么是 CASE表达式,我估计还真没几个人能清楚的表述出来。CASE表达式和 “2+1” 或者 “120/3” 这样的表达式一样,是一种进行运算的功能,正如CASE(情况)这个词的含义一样,用于区分情况,在有条件分歧的时候使用它。CASE表达式是从 SQL-92 标准开始被引入的,可能因为它是相对较新的技术,所以尽管使用起来非常便利,但其真正的价值却并不怎么为人所知。很多人不用它,或者用它的简略版函数,例如 DECODE(Oracle)、IF(MySQL)等。然而,CASE表达式也许是 SQL-92 标准里加入的最有用的特性,如果能用好它,那么 SQL 能解决的问题就会更广泛,写法也会更加漂亮,而且,因为 CASE表达式 是不依赖于具体数据库的技术,所以可以提高 SQL 代码的可移植性。
基本格式如下
-- 简单 CASE表达式
CASE 列(或表达式)
WHEN <匹配值1> THEN <表达式>
WHEN <匹配值2> THEN <表达式>
......
ELSE <表达式>
END -- 搜索 CASE表达式
CASE WHEN <判断表达式> THEN <表达式>
WHEN <判断表达式> THEN <表达式>
WHEN <判断表达式> THEN <表达式>
......
ELSE <表达式>
END -- 简单 CASE表达式 示例
CASE sex
WHEN '' THEN '男'
WHEN '' THEN '女'
ELSE '其他'
END -- 搜索CASE表达式 示例
CASE WHEN sex = '' THEN '男'
WHEN sex = '' THEN '女'
ELSE '其他'
END
CASE表达式 的 ELSE子句 可以省略,但推荐不要省略,省略了可能会出现我们意料之外的结果。END不能省,必须有。当 WHEN子句 为真时,CASE表达式 的真假值判断就会中止,而剩余的 WHEN子句会被忽略。为了避免引起不必要的混乱,使用 WHEN子句 时要注意条件的排他性。
简单CASE表达式正如其名,写法简单,但能实现的功能比较有限。简单CASE表达式能写的条件,搜索CASE表达式也能写,所以基本上采用搜索CASE表达式的写法。
CASE表达式 之妙用
上面讲了 CASE表达式 的理论知识,感觉不痛不痒,那么接下来我们进入实战篇,结合一些场景来看看 CASE表达式 的妙用
行转列
可能我们用的更多的是 IF(MySQL)或 DECODE(Oracle),但这两者都不是标准的 SQL,更推荐大家用 CASE表达式,移植性更高
假设我们有如下表,以及如下数据
CREATE TABLE t_customer_credit (
id INT(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增主键',
login_name VARCHAR(50) NOT NULL COMMENT '登录名',
credit_type TINYINT(1) NOT NULL COMMENT '额度类型,1:自由资金,2:冻结资金,3:优惠',
amount DECIMAL(22,6) NOT NULL DEFAULT '0.00000' COMMENT '额度值',
create_by VARCHAR(50) NOT NULL COMMENT '创建者',
create_time DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
update_time DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '创建时间',
update_by VARCHAR(50) NOT NULL COMMENT '修改者',
PRIMARY KEY (id)
);
INSERT INTO `t_customer_credit` VALUES (1, 'zhangsan', 1, 550.000000, 'system', '2019-7-7 11:30:09', '2019-7-8 20:21:05', 'system');
INSERT INTO `t_customer_credit` VALUES (2, 'zhangsan', 2, 0.000000, 'system', '2019-7-7 11:30:09', '2019-7-7 11:30:09', 'system');
INSERT INTO `t_customer_credit` VALUES (3, 'zhangsan', 3, 0.000000, 'system', '2019-7-7 11:30:09', '2019-7-7 11:30:09', 'system');
INSERT INTO `t_customer_credit` VALUES (4, 'lisi', 1, 0.000000, 'system', '2019-7-7 11:30:09', '2019-7-7 11:30:09', 'system');
INSERT INTO `t_customer_credit` VALUES (5, 'lisi', 2, 0.000000, 'system', '2019-7-7 11:30:09', '2019-7-7 11:30:09', 'system');
INSERT INTO `t_customer_credit` VALUES (6, 'lisi', 3, 0.000000, 'system', '2019-7-7 11:30:09', '2019-7-7 11:30:09', 'system');
如果我们要一行显示用户的三个额度,而不是 3 条记录显示 3 个额度,我们应该怎么做,方式有很多种,这里提供如下 3 种
-- 1、最容易想到的IF,不具备移植性,不推荐
SELECT login_name,
MAX(IF(credit_type=1, amount, 0)) freeAmount,
MAX(IF(credit_type=2, amount, 0)) freezeAmount,
MAX(IF(credit_type=3, amount, 0)) promotionAmount
FROM t_customer_credit GROUP BY login_name; -- 2、CASE表达式,标准的 SQL 规范,具备移植性,推荐使用
SELECT login_name,
MAX(CASE WHEN credit_type = 1 THEN amount ELSE 0 END) freeAmount,
MAX(CASE WHEN credit_type = 2 THEN amount ELSE 0 END) freezeAmount,
MAX(CASE WHEN credit_type = 3 THEN amount ELSE 0 END) promotionAmount
FROM t_customer_credit GROUP BY login_name; -- 3、自连接,数据量大的情况下,结合索引,效率不错,具备移植性
SELECT
a.login_name,a.amount freeAmount,
b.amount freezeAmount,
c.amount promotionAmount
FROM (
SELECT login_name, amount FROM t_customer_credit WHERE credit_type = 1
)a
LEFT JOIN t_customer_credit b ON a.login_name = b.login_name AND b.credit_type = 2
LEFT JOIN t_customer_credit c ON a.login_name = c.login_name AND c.credit_type = 3;
无论是 IF 还是 CASE表达式,都结合了 GROUP BY 与聚合函数,效率是个问题,而自连接是效率最高的,不管在不在 login_name 上加索引
转换统计
将已有编号方式转换为新的方式并统计,在进行非定制化统计时,我们经常会遇到将已有编号方式转换为另外一种便于分析的方式并进行统计的需求。假设我们有如下表
DROP TABLE t_province_population;
CREATE TABLE t_province_population (
id tinyint(2) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
province_name varchar(50) NOT NULL COMMENT '省份名',
sex tinyint(1) NOT NULL COMMENT '性别,1:男,2:女',
population int(11) NOT NULL COMMENT '人口数',
PRIMARY KEY (id)
); INSERT INTO t_province_population(province_name,sex,population)
VALUES
("黑龙江", 1 ,20),
("黑龙江", 2 ,18),
("内蒙古", 1 ,7),
("内蒙古", 2 ,8),
("海南", 1 ,20),
("海南", 2 ,22),
("西藏", 1 ,8),
("西藏", 2 ,7),
("浙江", 1 ,35),
("浙江", 2 ,35),
("台湾", 1 ,26),
("台湾", 2 ,23),
("河南", 1 ,40),
("河南", 2 ,38),
("湖北", 1 ,27),
("湖北", 2 ,24); SELECT * FROM t_province_population;
我们需要按各个省所在的位置,统计出东南西北中,各个区域内的人口数量
东:浙江、台湾,西:西藏,南:海南,北:黑龙江、内蒙古,中:湖北、河南
可能有人觉得这个表设计的不合理,应该在设计之初就应该多加一个区域字段(district)来标明各省所属区域。最好的做法确实是这样,但这得需要我们在设计之初的时候能考虑得到,或者有这样的需求,假设我们设计之初没有这样的需求,而我们也没考虑到,那么有没有什么办法来实现了? 我们可以这样来写 SQL
-- 通用写法,适用于多种数据库
SELECT CASE province_name
WHEN '浙江' THEN '东'
WHEN '台湾' THEN '东'
WHEN '海南' THEN '南'
WHEN '西藏' THEN '西'
WHEN '黑龙江' THEN '北'
WHEN '内蒙古' THEN '北'
WHEN '河南' THEN '中'
WHEN '湖北' THEN '种'
ELSE '其他' END district,
SUM(population) populations
FROM t_province_population
GROUP BY CASE province_name
WHEN '浙江' THEN '东'
WHEN '台湾' THEN '东'
WHEN '海南' THEN '南'
WHEN '西藏' THEN '西'
WHEN '黑龙江' THEN '北'
WHEN '内蒙古' THEN '北'
WHEN '河南' THEN '中'
WHEN '湖北' THEN '中'
ELSE '其他' END; -- MySQL支持写法,移植性差
SELECT CASE province_name
WHEN '浙江' THEN '东'
WHEN '台湾' THEN '东'
WHEN '海南' THEN '南'
WHEN '西藏' THEN '西'
WHEN '黑龙江' THEN '北'
WHEN '内蒙古' THEN '北'
WHEN '河南' THEN '中'
WHEN '湖北' THEN '中'
ELSE '其他' END district,
SUM(population) populations
FROM t_province_population
GROUP BY district;
结果如下
假设我们需要对各个省份做一个人口数级别的统计,统计出各个级别的数量
level_1:population < 20,level_2:20 <= population < 50 ,level_3:50 <= population < 70 ,level_4:>= 70;统计出 level_1 ~ level_4 的数量各有多少
SQL 与执行结果如下
SELECT
CASE WHEN population < 20 THEN 'level_1'
WHEN population >= 20 AND population < 50 THEN 'level_2'
WHEN population >= 50 AND population < 70 THEN 'level_3'
WHEN population >= 70 THEN 'level_4'
ELSE NULL
END pop_level,
COUNT(*) cnt
FROM (
SELECT province_name,SUM(population) population FROM t_province_population GROUP BY province_name
)a
GROUP BY
CASE WHEN population < 20 THEN 'level_1'
WHEN population >= 20 AND population < 50 THEN 'level_2'
WHEN population >= 50 AND population < 70 THEN 'level_3'
WHEN population >= 70 THEN 'level_4'
ELSE NULL
END;
这种转换统计还是比较常用的,重点就是 GROUP BY 子句的写法。
条件分支
SELECT 条件分支
还是以上面的 t_province_population 为例,如果我们想要直观的知道各个省份的男、女数量情况,类似如下
我们要怎么写 SQL? 有如下两种方法
-- 1、CASE表达式 集合 GROUP BY
SELECT province_name,
SUM(CASE WHEN sex = 1 THEN population ELSE 0 END) c,
SUM(CASE WHEN sex = 2 THEN population ELSE 0 END) f_pops
FROM t_province_population
GROUP BY province_name; -- 2、自关联
SELECT t.province_name, t.population m_pops, a.population f_pops
FROM t_province_population t
LEFT JOIN t_province_population a
ON t.province_name = a.province_name
WHERE t.sex = 1 AND a.sex = 2;
其实就是行转列,行转列更容易懂
UPDATE 条件分支
我们有一张薪资表,如下
CREATE TABLE t_user_salaries(
id int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
name varchar(50) NOT NULL COMMENT '姓名',
sex tinyint(1) NOT NULL COMMENT '性别,1:男,2:女',
salary int(11) NOT NULL COMMENT '薪资',
PRIMARY KEY (id)
); INSERT INTO t_user_salaries(name, sex,salary) VALUES
("张三", 1, 30000),
("李四", 1, 27000),
("王五", 1, 22000),
("菲菲", 2, 24000),
("赵六", 1, 29000); SELECT * FROM t_user_salaries;
假设现在需要根据以下条件对该表的数据进行更新:1、对当前工资为 30000 元以上的员工,降薪 10%,2、对当前工资为 25000 元以上且不满 28000 元的员工,加薪 20%。调整之后的薪资如下所示
乍一看,分别执行下面两个 UPDATE 操作好像就可以做到,但是我们执行下看看结果
-- 条件1
UPDATE t_user_salaries
SET salary = salary * 0.9
WHERE salary >= 30000; -- 条件2
UPDATE t_user_salaries
SET salary = salary * 1.2
WHERE salary >= 25000 AND salary < 28000;
我们发现张三的薪资不降反升了! 这是因为执行 条件1的SQL后,张三的薪资又满足条件2了,所以又更新了一遍,导致他的薪资变多了,有人可能会说,把条件1和条件2的SQL换下顺序不就好了吗,我们来试试
-- 条件2
UPDATE t_user_salaries
SET salary = salary * 1.2
WHERE salary >= 25000 AND salary < 28000; -- 条件1
UPDATE t_user_salaries
SET salary = salary * 0.9
WHERE salary >= 30000;
张三的薪资是降对了,可李四的薪资却涨错了!这是因为李四的薪资满足条件2,升了 20% 之后又满足条件1,又降了 10%。难道就没有就没有正确的方式了? 我们来看看这个 SQL
UPDATE t_user_salaries SET salary =
CASE WHEN salary >= 30000 THEN salary * 0.9
WHEN salary >= 25000 AND salary < 28000 THEN salary * 1.2
ELSE salary
END; SELECT * FROM t_user_salaries;
完美不? 特别完美,这个技巧的应用范围很广,值得我们掌握
CHECK 约束
注意:CHECK 是标准的 SQL,但是 MySQL 却没有实现它,所以 CHECK 在 MySQL 中是不起作用的!
回到我们的薪资表,假设某个公司有这样一个无理的规定:女性员工的工资不得高于50000,我们如果实现它? 方式有两种:1、代码层面控制 、2、数据库表加约束。
代码层面控制就不多说了,这我们平时最能想到的,实际也是用的最多的;那从表约束,我们该如何实现了,像这样吗?
-- 创建表的时候增加约束
CREATE TABLE t_user_salaries_check(
name varchar(50) NOT NULL COMMENT '姓名',
sex tinyint(1) NOT NULL COMMENT '性别,1:男,2:女',
salary int(11) NOT NULL COMMENT '薪资',
CONSTRAINT chk_sex_salary CHECK (sex=2 AND salary <= 50000)
); -- 若t_user_salaries_check已创建,则补充上约束
ALTER TABLE t_user_salaries_check
ADD CONSTRAINT chk_sex_salary CHECK (sex=2 AND salary <= 50000);
这么实现你会发现公司的男同事都会提着刀来找你了,因为没有他们的薪资,这个约束会导致录入不了男性的薪资! 因为我们的约束是:sex=2 AND salary < = 50000 表示 “是女性,并且薪资不能高于50000”,而不是:“如果是女性,薪资不高于50000”。正确的约束条件应该这么写
-- 创建表的时候增加约束
CREATE TABLE t_user_salaries_check(
name varchar(50) NOT NULL COMMENT '姓名',
sex tinyint(1) NOT NULL COMMENT '性别,1:男,2:女',
salary int(11) NOT NULL COMMENT '薪资',
PRIMARY KEY (id),
CONSTRAINT chk_sex_salary CHECK(
CASE WHEN sex = 2 THEN
CASE WHEN salary <= 50000 THEN 1
ELSE 0
END
ELSE 1
END = 1 )
); -- 若t_user_salaries_check已创建,则补充上约束
ALTER TABLE t_user_salaries_check
ADD CONSTRAINT chk_sex_salary CHECK(
CASE WHEN sex = 2 THEN
CASE WHEN salary <= 50000 THEN 1
ELSE 0
END
ELSE 1
END = 1
);
CASE表达式还有很多其他的用处,强大的不得了,而且高度灵活;用好它,能让我们写出更加契合的 SQL。
总结
1、CASE表达式 是支撑 SQL 声明式编程的根基之一,也是灵活运用 SQL 时不可或缺的基础技能。作为表达式,CASE 表达式在执行时会被判定为一个固定值,因此它可以写在聚合函数内部;也正因为它是表达式,所以还可以写在SELECE 子句、GROUP BY 子句、WHERE 子句、ORDER BY 子句里。简单点说,在能写列名和常量的地方,通常都可以写 CASE 表达式
2、写 CASE表达式 的注意点
a、各个分支返回的数据类型要一致
b、养成写 ELSE 的好习惯
c、不要忘了写 END
3、多条件时,用 OR 、AND 等谓词,IF 函数也一样
参考
《SQL基础教程》
《SQL进阶教程》
神奇的 SQL 之 CASE表达式,妙用多多 !的更多相关文章
- SQL的CASE表达式用法
case 表达式从SQL-92标准开始引入,因此是不依赖于具体的数据库技术,可提高SQL代码的可移植性. case表达式注意事项: 1. 统一各个分支返回数据类型,并保证各个when字句的排他性,因为 ...
- SQL Server case表达式的用法
★CASE表达式是一个标量表达式,它基于条件逻辑来返回一个值.因为CASE是一个标量表达式,所以它可以应用在SELECT.WHERE.HAVING以及ORDER BY子句中. CASE表达式有两种格式 ...
- Sql 基于列的Case表达式
Case表达式可以用在 Select,update ,delete ,set,in,where ,order by,having子句之后, 只是case表达式不能控制sql程序的流程,只能作为基于列的 ...
- 使用CASE表达式替代SQL Server中的动态SQL
原文:使用CASE表达式替代SQL Server中的动态SQL 翻译自: http://www.mssqltips.com/sqlservertip/1455/using-the-case-expre ...
- [SQL] SQL 基础知识梳理(六)- 函数、谓词、CASE 表达式
SQL 基础知识梳理(六)- 函数.谓词.CASE 表达式 目录 函数 谓词 CASE 表达式 一.函数 1.函数:输入某一值得到相应输出结果的功能,输入值称为“参数”,输出值称为“返回值”. 2. ...
- SQL基础学习_05_函数、谓词、CASE表达式
函数 算术函数 1. 四则运算: +.-.*./ 2. ABS:求绝对值, ABS(数值) 3. MOD: 求余,MOD(被除数,除数) 4. ROUND:四舍五入,ROUND(对象数值,保留小数的 ...
- SQL进阶1:case表达式的用法示例
一:case表达式的用法 1.SQL中的case表达式的作用是用来对"某个变量"进行某种转化,通常在select字句中使用,举个例子: 不能看出,case表达式很像我们的if el ...
- 《SQL 基础教程》第六章:函数、谓词、CASE 表达式
函数是 SQL 中的一部分.在 SQL 中,除了普通的函数之外,还有特殊的函数(谓词和 CASE 表达式)用于各种情况. 函数 函数的种类有: 算术函数 字符串函数 日期函数 转换函数(用于转换数据类 ...
- 6 SQL 函数、谓词、CASE表达式
6 函数.谓词.CASE表达式 6-1 各种各样的函数 /* 所谓函数,就是输入某一值得到相应输出结果的功能.输入值称为参数(parameter),输出值称为返回值. 函数大致可以分为以下几种 : 算 ...
随机推荐
- 快速删除mysql表中的数据
一.清空全部数据,不写日志,不可恢复,速度很快 truncate table 表名; 二.清空全部数据,写日志,可恢复,速度很慢 delete from 表名;
- SYN4102型 GPS同步时钟
SYN4102型 GPS同步时钟 产品概述 SYN4102型GPS同步时钟是由西安同步电子科技有限公司精心设计.自行研发生产的一款高精度锁相时钟频率源,接收GPS信号,使恒温晶振输出频率同步于GPS ...
- Kafka笔记5
Kafka使用zookeeper来维护集群成员的信息.每个broker都有一个唯一标识符,这个标识符可以在配置文件指定,也可以自动生成. 在broker停机,出现网络分区或者长时间垃圾回收停顿时,br ...
- EditPlus 格式化HTML JS CSS
首先你得安装一个EditPlus,然后下载你想格式化的xxxformatter.js文件,也就是网上说的EDTOOLS 1.在你的工具里边找到-->配置自定义工具 具体做法如下: 第5步 命令: ...
- 【React】react学习笔记03-React组件对象的三大属性-state
今天晚上学习了React中state的使用,特做此记录,对于学习的方式,博主仍然推荐直接复制完整代码,对着注释观察现象!: 上文中,我列举了两种React自定义组件的声明,这里我拿方式二进行举例: / ...
- chmod命令用法详解-chmod修改目录权限
chmod用法: 用来修改某个目录或文件的访问权限. 语法: chmod [-cfvR] [--help] [--version] [who] [+ | - | =] [mode] 文件名 例子: ...
- 一个commit引发的思考
这几天我翻了翻golang的提交记录,发现了一条很有意思的提交:bc593ea,这个提交看似简单,但是引人深思. commit讲了什么 commit的标题是"sync: document i ...
- Oracle基础学习笔记
Oracle基础学习笔记 最近找到一份实习工作,有点头疼的是,有阶段性考核,这...,实际想想看,大学期间只学过数据库原理,并没有针对某一数据库管理系统而系统的学习,这正好是一个机会,于是乎用了三天时 ...
- kubernetes实战篇之docker镜像的打包与加载
系列目录 前面我们讲到了使用nexus搭建docker镜像仓库,操作还是有点复杂的,可能有的童鞋仅仅是想尝试kubernetes功能,并不想在搭建仓库上花费过多时间,但是又想在不同的主机之间传递镜像. ...
- C++ luogu1352没有上司的舞会 from_树形DP
luogu1352没有上司的舞会 分析(树形DP模板题): 没学树形DP的,看一下. 把该题抽象到一颗树中,设i的下属就是他的儿子,则有两种情况: 如果i参加,他的儿子就不能参加. 如果i不参加,他的 ...