MySQL(五)汇总和分组数据
一、汇总数据
工作中经常需要汇总数据而不是将它们全部检索出来(实际数据本身:返回实际数据是对时间和处理资源的浪费),这种类型的检索有以下特点:
①确定表中的行数(或者满足某个条件或包含某个特定值的行数)
②获得表中行组的和
③找出表列(或所有行或某些特定的行)的最大值、最小值和平均值
聚集函数(aggregate function):运行在行组上,计算和返回单个值的函数(MySQL还支持一些列的标准偏差聚集函数);
SQL聚集函数如下表:
1、avg()函数
avg()通过对表中行数计数并计算特定列值之和,求得该列的平均值;avg()可用来返回所有列平均值,也可用来返回特定列的平均值;
select avg(prod_price) as avg_price from pfoducts;
此select语句返回值avg_price,它包含producs表中所有产品的平均价格,avg_price是一个别名;
avg()也可以用来确定特定列或行的平均值,例子如下:
select avg_(prod_price) as avg_price from products where vend_id = 1003;
这条SQL语句包含了where子语句,仅过滤出vend_id为1003的产品,avg_price中返回该供应商的产品的平均值;
PS:avg()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出,为了获得多个列的平均值,必须使用多个avg()函数{avg()函数忽略列值为NULL的行};
2、count()函数
count()函数进行计数,可利用count()确定表中行的数目或符合特定条件的行的数目;
count()函数有两种使用方式:
①使用count(*)对表中行的数目进行计数,不管表列中包含的是空值(null)还是非空值;
②使用count(column)对特定列中具有值的行进行计数,忽略null值;
select count(*) as num_cust from customers;
这条SQL语句利用count(*)对customers表中所有行计数,计数值在num_cust中返回;
select count(cust_email) as cum_cust from customers;
这条SQL语句使用count(cust_email)对cust_email列中有值的行进行计数;
PS:如果指定列名,则指定列的值为空的行被count()函数忽略,但如果count()函数中用的是星号(*),则不忽略;
3、max()函数
max()返回指定列中的最大值,max()要求指定列名,例子如下:
select max(prod_price) as max_price from products;
这条SQL语句中国返回products表中price列的最大值;
PS:MySQL允许max()用来返回任意列中的最大值,包括返回文本列的最大值;但用于文本数据时,如果数据按相应的列排序,则max()返回最后一行(max()函数忽略列值为null的行)
4、min()函数
min()返回指定列的最小值,min()也要求指定列名,例子如下:
select min(prod_price) as min_price from products;
这条SQL语句中min()返回products表中price列最小值;
PS:MySQL允许min()用来返回任意列中的最小值,包括返回文本列的最小值;但用于文本数据时,如果数据按相应的列排序,则min()返回最前面的行(min()函数忽略列值为null的行)
5、sum()函数
sum()函数用来返回指定列值的和(总计);例子如下:
select sum(quantity) as items_ordered from orderitems where order_num = 20005;
函数sum()返回orderitems中所有quantity列的值之和,where子句保证只统计某个指定列的数值;
PS:利用标准的算数操作符,所有聚集函数都可用来执行多个列上的计算(sum()函数忽略列值为null的行)
6、distinct与聚集函数
MySQL5.0.3以及之后的版本,聚集函数和distinct可以搭配使用,比如:
①对所有的行执行计算,指定all参数或不给参数(all是默认所有行为,不需要指定,如果不指定distinct,则假定为all);
②只包含不同的值,指定distinct参数;
③如果指定列名,则distinct只能用于count();distinct不能用于count(*),因此不允许使用count(distinct);distinct必须使用列名,不能用于计算或者表达式;
select avg(distinct prod_price) as avg_price from products where vend_id = 1003;
这条SQL语句中,使用avg()函数返回vend列中vend_id=1003的对应的price平均价格,因为使用了distinct参数,因此平均值只考虑不同的值(唯一值)
7、组合聚集函数
select语句可以包含多个聚集函数,比如:
select count(*) as num_items,
min(prod_price) as price_min,
max(prod_price) as price_max,
avg(prod_price) as price_avg
from products;
这条SQL语句,使用了单条select语句执行4个聚集计算,返回四个值(products表中items的数目、price的最高、最低以及平均值)
PS:在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名;这样便于使用SQL更加容易和理解,以及排除方便排除错误。
二、分组数据
1、group by创建分组
在MySQL中,分组是在select语句中的group by子句中建立的,比如:
select vend-id,count(*) as num_prods from products group by vend_id;
这条SQL语句指定了2个列,group by指示MySQL按照vend_id排序并且分组(如果使用group by,则不必指定要计算的每个组)
group by子句指示指示MySQL分组数据,然后都每个组而不是整个结果集进行聚集;关于group by使用,请注意以下规则:
①group by子句可以包含任意数目的列(使得对分组进行嵌套,为数据分组提供更细致的控制);
②如果在group by子句中嵌套分组,数据将在最后规定的分组上进行汇总,即:建立分组时,指定的所有列都一起计算(所以不能从个别列取回数据);
③group by子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数),如果在select中使用表达式,则必须在group by子句中指定相同的表达式(不能使用别名);
④除了聚集计算语句外,select中每个列都必须在group by子句中给出;
⑤如果分组列中具有null值,则null将作为一个分组返回(如果列中有多行null值,他们将分为一组);
⑥group by子句必须出现在where子句之后,order by子句之前;
PS:使用with rollup关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值。
2、having过滤分组
where子句都可以用having代替,区别在于where过滤行,having过滤分组;having支持所有的where操作符,比如:
select cust_id,count(*) as orders from orders group by cust_id having count(*) >= 2;
这条SQL语句中的having子句过滤count(*)>=2(2个以上的分组)的那些分组;
having和where的区别:
where在数据分组前进行过滤,having在数据分组后进行过滤;where排除的行不包括在分组中(这可能会改变计算值,从而影响having子句中基于这些值过滤掉的分组)
having和where可以同时使用,比如:
select vend_id, count(*) as num_prods from products where prod_price>=10 group by vend_id having count(*)>= 2;
这条SQL语句中,where子句过滤掉所有prod_price至少为10的行,然后按照vend_id分组数据;having子句过滤技术为2或2以上的分组;
3、分组和排序
group by和order by的区别:
order by的重要性:一般使用group by子句时,应该也给出order by子句,这是保证数据正确性的唯一方法(千万不要依赖group by排序数据)。
4、select子句顺序
MySQL(五)汇总和分组数据的更多相关文章
- MySQL数据库— 汇总和分组数据
一 汇总和分组数据 查询语句 ---> 结果集(多条数据) ---> 聚合函数 ----> 单行记录 1.常用的聚合函数: sum() 数字 ...
- MySQL数据库7 - 汇总和分组数据
一 汇总和分组数据 查询语句 ---> 结果集(多条数据) ---> 聚合函数 ----> 单行记录 1.常用的聚合函数: sum() 数字 ...
- MySQL笔记汇总
[目录] MySQL笔记汇总 一.mysql简介 数据简介 结构化查询语言 二.mysql命令行操作 三.数据库(表)更改 表相关 字段相关 索引相关 表引擎操作 四.数据库类型 数字型 字符串型 日 ...
- MySQL登录汇总
--MySQL登录汇总 --------------------2014/5/17 1. ERROR 1045错误ERROR 1045 (28000): Access denied for user ...
- MySQL优化汇总
1)mysql优化汇总,转载自网络
- Mysql查询优化汇总 order by优化例子,group by优化例子,limit优化例子,优化建议
Mysql查询优化汇总 order by优化例子,group by优化例子,limit优化例子,优化建议 索引 索引是一种存储引擎快速查询记录的一种数据结构. 注意 MYSQL一次查询只能使用一个索引 ...
- MYSQL 【汇总数据】 【分组数据】 学习记录
分组数据 1,创建分组:
- 快速回顾MySQL:汇总和分组
10.3 汇总数据 我们经常需要汇总数据而不用把它们实际检索处出来,为此MySQL提供了专门的函数.使用这些函数,MySQL查询可用于检索数据,以便分析和报表的生成.这种类型的检索例子有以下几种: 确 ...
- MySQL1:MySQL函数汇总
前言 MySQL提供了众多功能强大.方便易用的函数,使用这些函数,可以极大地提高用户对于数据库的管理效率,从而更加灵活地满足不同用户的需求.本文将MySQL的函数分类并汇总,以便以后用到的时候可以随时 ...
随机推荐
- c语言学习笔记-switch
我的邮箱地址:zytrenren@163.com欢迎大家交流学习纠错! 一.switch函数意义 选择性执行 二.switch函数结构 switch(表达式) { case: 常量表达式; 语句1; ...
- linux(乌班图)修改apt下载源
有时候会出现乌班图系统刚安装,无法使用apt下载安装软件工具,此时需要修改apt下载源. 1.进入/etc/apt/目录下 2.备份sources.list文件(如果不在root用户下,需在前面加s ...
- C#委托之我见
委托的使用方式很简单,了解一下基本语法就可以开撸了.但是使用委托的真正难题是不知道应用场景,就像习得了一门新功夫,但是却找不到任何施展拳脚的地方.这个难题一直困然着我,直到最近仿佛有所领悟,所以赶紧记 ...
- Python使用map,reduce高阶函数模拟实现Spark的reduceByKey算子功能
# 使用默认的高阶函数map和reduce import randomdef map_function(arg): # 生成测试数据 return (arg,1) list_map = list(m ...
- Python进阶点
1. 模块化设计,分而治之 2. 组合数据类型 2.1 集合类型:list.set(无序/不重复),用于数据去重 2.2 序列类型:字符串.元组.列表(有序) 2.3 字典类型:根据字典中 k/v 来 ...
- C#重试公用类
//Retry机制 public static class RetryExecutor { /// <summary> /// 重试零个参数无返回值的方法 /// </summary ...
- [HDFS_1] HDFS 的概念和特性
0. 参考 HDFS你一定要知道,要考的 大数据开发实战:HDFS和MapReduce优缺点分析 SecondaryNamenode的作用详解 1. HDFS 是什么 HDFS :一种分布式文件系统, ...
- 【PAT】B1042 字符统计(20 分)
/* 15分的题很简单,但是自己写的时候在输入数据时没有考虑好下标 另外有忘记了输入字符时考虑是否有\n */ #include<stdio.h> #include<algorith ...
- 用python写个简单的小程序,编译成exe跑在win10上
每天的工作其实很无聊,早知道应该去IT公司闯荡的.最近的工作内容是每逢一个整点,从早7点到晚11点,去查一次客流数据,整理到表格中,上交给素未蒙面的上线,由他呈交领导查阅. 人的精力毕竟是有限的,所以 ...
- 【17】有关python面向对象编程的提高【多继承、多态、类属性、动态添加与限制添加属性与方法、@property】
一.多继承 案例1:小孩继承自爸爸,妈妈.在程序入口模块再创建实例调用执行 #father模块 class Father(object): def __init__(self,money): self ...