图解AI数学基础 | 概率与统计】的更多相关文章

作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/83 本文地址:http://www.showmeai.tech/article-detail/163 声明:版权所有,转载请联系平台与作者并注明出处 1.概率论及在AI中的使用 概率(Probability),反映随机事件出现的可能性大小.事件\(A\)出现的概率,用\(P(A)\)表示. 概率论(Probability Theory),是研究随机现象数量规律的数学分支,度量事物的不…
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/83 本文地址:http://www.showmeai.tech/article-detail/162 声明:版权所有,转载请联系平台与作者并注明出处 1.标量(Scalar) 一个标量就是一个单独的数.只具有数值大小,没有方向(部分有正负之分),运算遵循一般的代数法则. 一般用小写的变量名称表示. 质量\(m\).速率\(v\).时间\(t\).电阻\(\rho\) 等物理量,都是数…
目录 简介 蒙题霍尔问题 上帝视角解决概率问题 上帝视角的好处 简介 天要下雨,娘要嫁人.虽然我们不能控制未来的走向,但是可以一定程度上预测为来事情发生的可能性.而这种可能性就叫做概率.什么是概率呢?概率就是事情出现的可能性.比如扔骰子,我们知道骰子有六面,很容易知道扔出1点的概率是1/6,听起来很简单,但是如果放在复杂事件中,概率计算就变得比较麻烦和抽象,很多时候,我们可能没办法很简单的进行计算.今天我们来介绍一个计算概率的完全不同的视角:上帝视角. 蒙题霍尔问题 蒙题霍尔问题出自美国的一个电…
这一篇比较简单,就不展开记录了,方差和标准差的计算方法记住了就可以. 计算mean 计算每个样本与mean的差值的平方,将其累加后除以(样本数-1)[注:这里的除数可以是n-1也可以是n],即得到方差 方差开根号,即得到标准差 另外,记得标准差和方差都是衡量样本集中程度的,方差或标准差越大,样本越向两边离散:方差或标准差越小,样本越向mean集中. 标准差在对称分布下面,有几个在统计学上非常有用的数字:68%,95%,99.7%,意思是: 用median和标准差stdDev(下面简称SD)的1倍…
什么是熵(entropy)? 1.1 熵的引入 事实上,熵的英文原文为entropy,最初由德国物理学家鲁道夫·克劳修斯提出,其表达式为: 它表示一个系系统在不受外部干扰时,其内部最稳定的状态.后来一中国学者翻译entropy时,考虑到entropy是能量Q跟温度T的商,且跟火有关,便把entropy形象的翻译成“熵”. 我们知道,任何粒子的常态都是随机运动,也就是"无序运动",如果让粒子呈现"有序化",必须耗费能量.所以,温度(热能)可以被看作"有序化&…
介绍箱线图之前,需要先介绍若干个其需要的术语 min:整个样本的最小值 max:整个样本的最大值 Range:即整个样本的取值范围,Range = max - min Inter-Quartile Range (IQR):四分之一range,即通过取3次中位数(median),将整个range分成四等份,其中间的两份就是IQR,下面图示说明一下: 计算方法: 1. 先对整个样本值集合计算median,将数据分为两等份: 2. 分别对前后两份数据再次计算median: 3. 则Q3 - Q1 =…
茎叶图的只做方法如下: 将每个数字分成茎和叶 对所有茎排序,并纵向从小到大放置好 对相同茎下的叶归到一起并排序,垂直于茎的排列方向放置好 举个例子:我们有一份奥斯卡影后的年龄集合: 34 34 27 37 42 41 36 32 41 33 31 74 33 49 38 61 21 41 26 80 42 29 33 36 45 49 39 34 26 25 33 35 35 28 30 29 61 32 33 45 29 62 22 44 按照上述方法做出茎叶图: 上图中,先分析了一下年龄的数…
单个定量变量的直方图表示 大家知道,定量变量是连续型变量,即不会像分类变量那样有明显的分类,那么如何将其画成直方图呢?一般来说,会将其按照某个维度来将其分组(group),举个例子. 我们有15个学生的考试成绩:88, 48, 60, 51, 57, 85, 69, 75, 97, 72, 71, 79, 65, 63, 73 如果要画成直方图,X轴是成绩,Y轴是对应的人数,那么X轴可以考虑按“每10分”作为一个group,即[0, 10), [10, 20), [20, 30), ... ,[…
探索性数据分析(Exploratory Data Analysis) 本节课程先从统计分析四步骤中的第二步:EDA开始. 课程定义了若干个术语,如果学习过机器学习的同学,应该很容易类比理解: population:上节课说过,整体数据集合被称作population individual:其中每个个体,课程里称之为individual,注意不仅仅指个人,也可以泛指其他集合的其中一条数据 variable:变量,即描述个体的某个特点,类比机器学习中的特征 dataset:从population中圈定…