献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解

数据分析基础概念:
集中趋势分析是指在大量测评数据分布中,测评数据向某点集中的情况。
总体(population)是指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。简单地说,总体也就是我们所研究的性质相同个体的总和,用符号N表示。
样本(sample),是指从总体中抽出的一部分个体。样本中所包含个体数目称样本容量或含量,用符号n表示。
标准差与方差的区别:从公式上可以很明显看出,方差是标准差的平方,其余一模一样。
那它们二者的区别就体现在,标准差是以最初的单位存在,而方差是以平方单位存在。

建立准备分析环境:
蜀汉五虎上将,是指罗贯中的长篇小说《三国演义》中,蜀汉昭烈帝刘备麾下的五员猛将,分别是:关羽、张飞、赵云、马超、黄忠。原文描写为“五虎大将”,后人惯称“五虎上将”。

SELECT  *
FROM FactSanguo11
WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )


关羽、张飞、赵云、马超、黄忠武力值为:97,98,96,97,93
分析过程:

验证分析结果:

SELECT  AVG([武力]) AS 均值 ,
VARP([武力]) AS 总体方差 ,
VAR([武力]) AS 样本方差 ,
STDEVP([武力]) AS 总体标准差 ,
STDEV([武力]) AS 样本标准差
FROM FactSanguo11
WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )

魏五子良将
五子良将是指三国时期,曹魏势力的五位将军,即前将军张辽、右将军乐进、左将军于禁、征西车骑将军张郃以及右将军徐晃。
陈寿撰写魏书卷十七时,将此五人合传,叙述诸将生平事迹后评曰:“太祖建兹武功,而时之良将,五子为先”,因此现代人将其称之为“五子良将”或“魏五子”。

SELECT  *
FROM FactSanguo11
WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )


张辽、乐进、于禁、张郃、徐晃 武力值为:92,84,78,89,90
分析过程:

验证分析结果:

SELECT  AVG([武力]) AS 均值 ,
VARP([武力]) AS 总体方差 ,
VAR([武力]) AS 样本方差 ,
STDEVP([武力]) AS 总体标准差 ,
STDEV([武力]) AS 样本标准差
FROM FactSanguo11
WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )

分析结论:

蜀汉五虎上将

魏五子良将

1均值

96.2

86.6

2中位数

97

89

3众数

97

-

4最大

98

92

5最小

93

78

6极差

5

14

7总体方差

2.96

25.44

8总体标准差

1.72

5.04

9样本方差

3.7

31.80

10样本标准差

1.92

5.64

11 CV(sample)

1.9958%

CV(sample)= (1.92/96.2)*100%=1.9958%

6.5127%

CV(sample)= (5.64/86.6)*100%=6.5127%

附录:蜀汉五虎上将、魏五子良将配图

《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析的更多相关文章

  1. 《BI那点儿事—数据的艺术》目录索引

    原创·<BI那点儿事—数据的艺术>教程免费发布 各位园友,大家好,我是Bobby,在学习BI和开发的项目的过程中有一些感悟和想法,整理和编写了一些学习资料,本来只是内部学习使用,但为了方便 ...

  2. 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分

    什么是聚类分析? 聚类分析属于探索性的数据分析方法.通常,我们利用聚类分析将看似无序的对象进行分组.归类,以达到更好地理解研究对象的目的.聚类结果要求组内对象相似性较高,组间对象相似性较低.在三国数据 ...

  3. 《BI那点儿事》双变量的相关分析——相关系数

    例如,“三国人物是否智力越高,政治就越高”,或是“是否武力越高,统率也越高:准备数据分析环境: SELECT * FROM FactSanguo11 WHERE 姓名 IN ( N'荀彧', N'荀攸 ...

  4. R语言数据分析系列六

    R语言数据分析系列六 -- by comaple.zhang 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候怎样下手分析,数据分析的第一步.探索性数据分析. 统计量,即统计学里面关注的数据集 ...

  5. 传统BI还是自助式BI---BI与数据分析 ZT

    自助式BI或者自助式数据分析是最近几年兴起的一个概念.根据Gartner发布的信息,Self Service Business Intelligence(SSBI)被定义为“终端用户在被批准和支持的平 ...

  6. Quick BI助力云上大数据分析---深圳云栖大会

    在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析.大会现场的精彩分享也赢得观众们的一直认可和热烈的反响. 大数据分析之路的挑 ...

  7. R语言数据分析系列之四

    R语言数据分析系列之四 -- by comaple.zhang 说到统计分析我们就离不开随机变量,所谓随机变量就是数学家们为了更好的拟合现实世界的数据而建立的数学模型.有了她我们甚至能够来预測一个站点 ...

  8. R语言数据分析系列之五

    R语言数据分析系列之五 -- by comaple.zhang 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi ...

  9. 数据分析系列篇:玩转excel

    数据分析系列篇:玩转excel 不知道现在怎么也变得这么鸡婆,连excel都要准备写一篇.没办法,还有很多不是做数据的小伙伴们不会excel啊,抱着不抛弃.不放弃的态度,就讲下excel如何玩转.其实 ...

随机推荐

  1. fio

    h3.western { font-family: "Liberation Sans", sans-serif; font-size: 14pt } h3.cjk { font-f ...

  2. PHP获取远程网站的服务器时间

    <?php function get_time($server){ $data  = "HEAD / HTTP/1.1\r\n"; $data .= "Host:  ...

  3. 关于HTML5中video标签的奇怪现象

    很多人刚开始学习html5 的时候在使用video标签时会出现这样的情况: 发现video标签在网页中播放时只有声音但是没有图像,如: <!DOCTYPE html> <html&g ...

  4. 蓝牙物理链路类型:SCO和ACL链路

    蓝牙物理链路ACL(Asynchronous Connectionless), 另外的一种链路是SCO(Synchronous Connection Oriented)主要用来传输对时间要求很高的数据 ...

  5. 使用Mod_JK链接Apache和Tomcat

    There are many potential problems associated with the default configuration of mod_jk.  Let's say it ...

  6. zabbix的一些优化参数随笔

    StartDBSyncers=12  如果proxy过多 可以适当加大这个参数 ProxyConfigFrequency=60ProxyDataFrequency=60 这两个参数很重要,一个是ser ...

  7. 加密解密及其javascript实现

    前端提交数据到后台,如果不适用https协议,则提交的数据就有被第三者窃取的可能.前端使用js来编码数据主要分为以下三种: 1.摘要算法 2.对称加密 3.非对称加密 下面分别介绍三种算法中对应的一个 ...

  8. 1029-c语言文法的理解

    <程序>→<外部声明>|<程序><外部声明> <外部声明>→<函数定义>|<声明> <函数定义>→< ...

  9. 在SQLite Expert上用日期类型字段作为条件查询时注意日期的格式化

    经验之谈: 情况一:没有查询结果 and R_CheckInTime > '2015-7-12 18:47:00' and R_CheckInTime < '2015-7-18 18:48 ...

  10. csuoj 1505: 酷酷的单词

    http://acm.csu.edu.cn/OnlineJudge/problem.php?id=1505 1505: 酷酷的单词 时间限制: 1 Sec  内存限制: 128 MB 提交: 340  ...