《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析
献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解
数据分析基础概念:
集中趋势分析是指在大量测评数据分布中,测评数据向某点集中的情况。
总体(population)是指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。简单地说,总体也就是我们所研究的性质相同个体的总和,用符号N表示。
样本(sample),是指从总体中抽出的一部分个体。样本中所包含个体数目称样本容量或含量,用符号n表示。
标准差与方差的区别:从公式上可以很明显看出,方差是标准差的平方,其余一模一样。
那它们二者的区别就体现在,标准差是以最初的单位存在,而方差是以平方单位存在。
建立准备分析环境:
蜀汉五虎上将,是指罗贯中的长篇小说《三国演义》中,蜀汉昭烈帝刘备麾下的五员猛将,分别是:关羽、张飞、赵云、马超、黄忠。原文描写为“五虎大将”,后人惯称“五虎上将”。
SELECT *
FROM FactSanguo11
WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )
关羽、张飞、赵云、马超、黄忠武力值为:97,98,96,97,93
分析过程:
验证分析结果:
SELECT AVG([武力]) AS 均值 ,
VARP([武力]) AS 总体方差 ,
VAR([武力]) AS 样本方差 ,
STDEVP([武力]) AS 总体标准差 ,
STDEV([武力]) AS 样本标准差
FROM FactSanguo11
WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )
魏五子良将
五子良将是指三国时期,曹魏势力的五位将军,即前将军张辽、右将军乐进、左将军于禁、征西车骑将军张郃以及右将军徐晃。
陈寿撰写魏书卷十七时,将此五人合传,叙述诸将生平事迹后评曰:“太祖建兹武功,而时之良将,五子为先”,因此现代人将其称之为“五子良将”或“魏五子”。
SELECT *
FROM FactSanguo11
WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )
张辽、乐进、于禁、张郃、徐晃 武力值为:92,84,78,89,90
分析过程:
验证分析结果:
SELECT AVG([武力]) AS 均值 ,
VARP([武力]) AS 总体方差 ,
VAR([武力]) AS 样本方差 ,
STDEVP([武力]) AS 总体标准差 ,
STDEV([武力]) AS 样本标准差
FROM FactSanguo11
WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )
分析结论:
蜀汉五虎上将 |
魏五子良将 |
|
1均值 |
96.2 |
86.6 |
2中位数 |
97 |
89 |
3众数 |
97 |
- |
4最大 |
98 |
92 |
5最小 |
93 |
78 |
6极差 |
5 |
14 |
7总体方差 |
2.96 |
25.44 |
8总体标准差 |
1.72 |
5.04 |
9样本方差 |
3.7 |
31.80 |
10样本标准差 |
1.92 |
5.64 |
11 CV(sample) |
1.9958% CV(sample)= (1.92/96.2)*100%=1.9958% |
6.5127% CV(sample)= (5.64/86.6)*100%=6.5127% |
附录:蜀汉五虎上将、魏五子良将配图
《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析的更多相关文章
- 《BI那点儿事—数据的艺术》目录索引
原创·<BI那点儿事—数据的艺术>教程免费发布 各位园友,大家好,我是Bobby,在学习BI和开发的项目的过程中有一些感悟和想法,整理和编写了一些学习资料,本来只是内部学习使用,但为了方便 ...
- 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
什么是聚类分析? 聚类分析属于探索性的数据分析方法.通常,我们利用聚类分析将看似无序的对象进行分组.归类,以达到更好地理解研究对象的目的.聚类结果要求组内对象相似性较高,组间对象相似性较低.在三国数据 ...
- 《BI那点儿事》双变量的相关分析——相关系数
例如,“三国人物是否智力越高,政治就越高”,或是“是否武力越高,统率也越高:准备数据分析环境: SELECT * FROM FactSanguo11 WHERE 姓名 IN ( N'荀彧', N'荀攸 ...
- R语言数据分析系列六
R语言数据分析系列六 -- by comaple.zhang 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候怎样下手分析,数据分析的第一步.探索性数据分析. 统计量,即统计学里面关注的数据集 ...
- 传统BI还是自助式BI---BI与数据分析 ZT
自助式BI或者自助式数据分析是最近几年兴起的一个概念.根据Gartner发布的信息,Self Service Business Intelligence(SSBI)被定义为“终端用户在被批准和支持的平 ...
- Quick BI助力云上大数据分析---深圳云栖大会
在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析.大会现场的精彩分享也赢得观众们的一直认可和热烈的反响. 大数据分析之路的挑 ...
- R语言数据分析系列之四
R语言数据分析系列之四 -- by comaple.zhang 说到统计分析我们就离不开随机变量,所谓随机变量就是数学家们为了更好的拟合现实世界的数据而建立的数学模型.有了她我们甚至能够来预測一个站点 ...
- R语言数据分析系列之五
R语言数据分析系列之五 -- by comaple.zhang 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi ...
- 数据分析系列篇:玩转excel
数据分析系列篇:玩转excel 不知道现在怎么也变得这么鸡婆,连excel都要准备写一篇.没办法,还有很多不是做数据的小伙伴们不会excel啊,抱着不抛弃.不放弃的态度,就讲下excel如何玩转.其实 ...
随机推荐
- 数据访问的历史 Windows
节选:Programming Microsoft Visual Basic 6.0 1999 The Data Access Saga All the new database-related cap ...
- Socket请求和Http请求的各自特点、区别及适用场景
Socket实现服务器与客户端之间的物理连接,并进行数据传输.主要有TCP/UDP两个协议.Socket处于网络协议的传输层.TCP:传输控制协议,面向连接的的协议,稳定可靠.当客户和服务器彼此交换数 ...
- mysql单表多timestamp的current_timestamp设置问题
一个表中出现多个timestamp并设置其中一个为current_timestamp的时候经常会遇到 1293 - Incorrect table definition; there can be o ...
- Thinking in Java——笔记(10)
Inner Classes It allows you to group classes that logically belong together and to control the visib ...
- 【转】Unity中的协同程序-使用Promise进行封装(三)
原文:http://gad.qq.com/program/translateview/7170967 译者:崔国军(飞扬971) 审校:王磊(未来的未来) 在这个系列的最后一部分文章,我们要通过 ...
- Nginx下Magento伪静态规则,适用于LNMP一键包
文件名为:magento.conf(下载),将其放在 /usr/local/nginx/conf/ 文件夹下 然后在 /usr/local/nginx/conf/vhost/www.yourname. ...
- 当div自适应的高度超过预设的高度的时候出现滚动条的办法
方法一:主要是 min-height:50px; max-height:200px;overflow: auto; <div id="ss" style="widt ...
- favicon.ico的制作
1.选取需要的图片(jpg的格式等) 2.在网上搜索favicon.ico的制作,将jpg转为ico 3.在html中输入<link rel="shortcut icon" ...
- erlang rabbitmq-server安装
erlang rabbitmq-server安装 yum -y install xsltproc fop tk unixODBC unixODBC-devel make gcc gcc-c++ k ...
- html中表table行循环滚动例子
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"><HTML><meta h ...