Having子句用法

Having基础用法

集合结果指定条件

注：HAVING子句中能够使用三种要素：常数，聚合函数，GROUP BY子句中指定的列名(聚合建)

HAVING子句：

用having就一定要和group by连用，用group by不一有having（它只是一个筛选条件用的）

商品品种分组后结果中筛选出数据行数为2行的数据:

SELECT product_type, COUNT(*)

    FROM Product

  GROUP BY product_type

 HAVING COUNT(*) = 2;

平均数,销售价格大于2500的

SELECT product_type, AVG(sale_price)

	FROM Product

 GROUP BY product_type

HAVING AVG(sale_price) >= 2500;

相对于HAVING子句，更适合写再Where子句中的条件：

where子句 = 指定行所对应的条件
having子句 = 指定组所对应的条件

聚合建所对应的条件不应该书写在HAVING子句中，而应书写在WHERE子句当中。虽执行结果一样，但将条件写在where子句中比写在having子句中的处理速度更快，返回结果时间更短。

原因：聚合操作时，DBMS内部会进行排序处理，where在排序之前就对数据进行过滤，having是在排序之后在对数据进行分组。

-- 先过滤后分组

SELECT product_type, COUNT(*)

	FROM Product

 GROUP BY product_type

HAVING product_type = '衣服';

-- 先分组后过滤（性能差点）

SELECT product_type, COUNT(*)

	FROM Product

WHERE product_type = '衣服'

 GROUP BY product_type;

寻找缺失编号

seq	name
1	小明
2	小红
3	小王
5	小李
6	小黄
8	小小

-- 查看是否存在缺失编号

SELECT '存在缺失的编号' AS gap

FROM SeqTbl

HAVING COUNT(*) <> MAX(seq);

-- 查询缺失编号的最小值

SELECT MIN(seq + 1) AS ga

FROM SeqTbl

WHERE (seq+ 1) NOT IN ( SELECT seq FROM SeqTbl)

如果表 SeqTbl 里包含 NULL ，那么这条 SQL 语句的查询结果就不正确了（因为null值表示不确定）

用 HAVING 子句进行子查询：求众数

平均值有一个缺点，那就是很容易受到离群值（outlier）的影响。这种时候就必须使用更能准确反映出群体趋势的指标——众数（mode）就是其中之一。它指的是在群体中出现次数最多的值

CREATE TABLE Graduates

(name   VARCHAR(16) PRIMARY KEY,

 income INTEGER NOT NULL);

-- 桑普森是个离群值，会拉高平均数

INSERT INTO Graduates VALUES('桑普森', 400000);

INSERT INTO Graduates VALUES('迈克',     30000);

INSERT INTO Graduates VALUES('怀特',   20000);

INSERT INTO Graduates VALUES('阿诺德', 20000);

INSERT INTO Graduates VALUES('史密斯',     20000);

INSERT INTO Graduates VALUES('劳伦斯',   15000);

INSERT INTO Graduates VALUES('哈德逊',   15000);

INSERT INTO Graduates VALUES('肯特',     10000);

INSERT INTO Graduates VALUES('贝克',   10000);

INSERT INTO Graduates VALUES('斯科特',   10000);

-- 众数的SQL 语句(1)：使用谓词

SELECT income, COUNT(*) AS cnt

FROM Graduates

GROUP BY income HAVING COUNT(*) >= ALL ( SELECT COUNT(*) FROM Graduates GROUP BY income)

ALL 谓词用于 NULL 或空集时会出现问题，可以用极值函数来代替

-- 求众数的SQL 语句(2) ：使用极值函数

SELECT income, COUNT(*) AS cnt

FROM Graduates

GROUP BY incomeHAVING COUNT(*) >= ( SELECT MAX(cnt)

                                    FROM ( SELECT COUNT(*) AS cnt

                                           FROM Graduates

                                           GROUP BY income) TMP )

用 HAVING 子句进行自连接：求中位数

中位数：统计学中的专有名词，代表一个样本、种群或概率分布中的一个数值，其可将数值集合划分为相等的上下两部分。

-- 将集合里的元素按照大小分为上半部分和下半部分两个子集，同时让这 2 个子集共同拥有集合正中间的元素

SELECT T1.income FROM Graduates T1, Graduates T2 GROUP BY T1.income

		HAVING SUM(CASE WHEN T2.income >= T1.income THEN 1 ELSE 0 END) >= COUNT(*) / 2

           AND SUM(CASE WHEN T2.income <= T1.income THEN 1 ELSE 0 END) >= COUNT(*) / 2 

-- 将上下部分集合平均然后得中值

 SELECT AVG(DISTINCT income) FROM (

SELECT T1.income FROM Graduates T1, Graduates T2 GROUP BY T1.income

				HAVING SUM(CASE WHEN T2.income >= T1.income THEN 1 ELSE 0 END) >= COUNT(*) / 2

           AND SUM(CASE WHEN T2.income <= T1.income THEN 1 ELSE 0 END) >= COUNT(*) / 2 ) TMP;

查询不包含 NULL 的集合

COUNT()和COUNT(列)的区别：

第一个是性能上的区别；

第二个是 COUNT()可以用于NULL，而COUNT(列名)与其他聚合函数一样，要先排除掉NULL 的行再进行统计。

CREATE TABLE Students

(student_id   INTEGER PRIMARY KEY,

 dpt          VARCHAR(16) NOT NULL,

 sbmt_date    DATE);

INSERT INTO Students VALUES(100,  '理学院',   '2005-10-10');

INSERT INTO Students VALUES(101,  '理学院',   '2005-09-22');

INSERT INTO Students VALUES(102,  '文学院',   NULL);

INSERT INTO Students VALUES(103,  '文学院',   '2005-09-10');

INSERT INTO Students VALUES(200,  '文学院',   '2005-09-22');

INSERT INTO Students VALUES(201,  '工学院',   NULL);

INSERT INTO Students VALUES(202,  '经济学院', '2005-09-25');

-- 查询“提交日期”列内不包含NULL 的学院(1) ：使用COUNT 函数

SELECT dpt

FROM Students

GROUP BY dpt

HAVING COUNT(*) = COUNT(sbmt_date); 

-- 查询“提交日期”列内不包含NULL 的学院(2) ：使用CASE 表达式

SELECT dpt

FROM Students

GROUP BY dpt

HAVING COUNT(*) = SUM(CASE WHEN sbmt_date IS NOT NULL THEN 1 ELSE 0 END);

Having子句用法的更多相关文章

sql语句having子句用法，很多时候你曾忘掉
显示每个地区的总人口数和总面积．仅显示那些面积超过1000000的地区. SELECT region, SUM(population), SUM(area) FROM bbc GROUP BY reg ...
mysql LIMIT 子句用法及原理
使用查询语句的时候,经常要返回前几条或者中间某几行数据,这个时候怎么办呢?不用担心,已经为我们提供了这样一个功能. LIMIT 子句可以被用于强制 SELECT 语句返回指定的记录数.LIMIT 接 ...
SQL Server output子句用法 output inserted.id 获取刚插入数据的id
--插入数据,并返回刚刚插入的数据id INSERT INTO [soloreztest] ([name]) output inserted.id VALUES ('solorez') --执行结果: ...
Oracle学习之start with...connect by子句的用法
转自:http://www.blogjava.net/xzclog/archive/2010/03/05/314642.html,多谢博主分享 Oracle中start with…connect by ...
Hierarchical query-层次查询之START WITH CONNECT BY用法
Hierarchical query-层次查询中start with...connect by prior子句用法: connect by 是结构化查询中用到的,其基本语法是: select ... ...
OpenMP用法大全
OpenMP基本概念OpenMP是一种用于共享内存并行系统的多线程程序设计方案,支持的编程语言包括C.C++和Fortran.OpenMP提供了对并行算法的高层抽象描述,特别适合在多核CPU机器上的并 ...
java基础高级2 MySQL 高级
1.数据库简介 DDL(数据定义语言) DML(数据操作语言) 2. 准备工作解压缩文件目录下找到my.ini文件,文件中写入[mysql] default-character set= utf-8 ...
sql 几点记录
1 With子句 1.1 学习目标掌握with子句用法,并且了解with子句能够提高查询效率的原因. 1.2 With子句要点 with子句的返回结果存到用户的临时表 ...
并行计算之OpenMP中的任务调度
本文参考<OpenMP中的任务调度>博文,主要讲的是OpenMP中的schedule子句用法. 一.应用需求在OpenMP并行计算中,任务调度主要用于并行的for循环.当for循环中每次 ...

随机推荐

How to change java version in Linux
How to change default Java version on Linux Posted on November 1, 2015 by Dan Nanni Leave a comment ...
Linux 下rm+grep删除除去指定文件的剩余所有文件
例如: 删除当前文件夹下 .c和 .h 文件以外的文件 rm -f `ls ./ | egrep -v "(.c$|.h$)"` 1. ls 列出所有文件; 2. ...
洛谷 P3184 [USACO16DEC]Counting Haybales数草垛
P3184 [USACO16DEC]Counting Haybales数草垛题目描述 Farmer John has just arranged his NN haybales (1 \leq N ...
HPC2013小节
对于高性能计算,三个分支能耗.高性能.容错.下面我对会议的主要内容作一个小节,很多问题也是不求甚解. 下面针对大会内容,我主要总结如下,会有了解不周的地方,欢迎讨论:大会主要报告分成3个方向,1.基础 ...
个人常常使用的一些Eclipse技巧
引言为了加快开发效率,方便地浏览源代码,重构以及重写一些方法等,Eclipse给我们提供了非常多方便的快捷键以及小技巧.以下是我总结一下经常使用的快捷键和技巧. 快捷键清理控制台(console) ...
Codeforces Round #281 (Div. 2) A. Vasya and Football 暴力
A. Vasya and Football Vasya has started watching football games. He has learned that for some foul ...
python多线程,限制线程数
#encoding:utf8 import threading import time data = 0 def func(sleeptime): global data print threadin ...
CSS--浏览器CSS Hack 收集
所谓的Hack就是只有特定浏览器才能识别这段hack代码.Hack 不是什么好东西,除非没有办法,我们尽量还是不要用着玩意. 下面是各个浏览器的CSS Hack 列表. Firefox 浏览器 @-m ...
JPA新增entity时自动填充时间，例创建时间，修改时间
背景:springboot项目,集成JPA,与数据库交互的entity,与用户交互的DTO 问题:添加酒店时,两个字段create_time,update_time,前端不传数据,如果赋值解决: 1 ...
RabbltMQ
协议:AMQP协议支持事务端口号:默认端口5672 1.简单队列(simple queue) 一个生产者对应一个消费者 2.工作队列(work queue) 一个生产者对应多个消费者: 轮询分发 ...