常见的概率分布类型(二)(Probability Distribution II)
以下是几种常见的离散型概率分布和连续型概率分布类型:
伯努利分布(Bernoulli Distribution):常称为0-1分布,即它的随机变量只取值0或者1。
伯努利试验是单次随机试验,只有"成功"(1)或"失败"(0)这两种结果。假如某次伯努利实验成功的概率为p,失败的概率为q=1-p,那么实验成功或失败的概率可以写成:。
伯努利分布的期望:
伯努利分布的方差:
二项分布(Binomial Distribution):用以描述n次独立的伯努利实验中有x次成功的概率。
假如每次伯努利实验成功的概率为p,失败的概率为q=1-p,那么n次独立的伯努利实验中有x次成功的概率是:。这就是二项分布的概率质量函数。
二项分布的期望:E(x)=μ=np
二项分布的方差:Var(x)=σ2=npq
最常见的二项分布问题就是多次投硬币:投掷10次均匀的硬币,其中恰好有5次正面朝上的概率是多少?
投掷10次均匀的硬币,其中至少有8次正面朝上的概率是多少?
当n>50,p<0.1时,二项分布可以转换成泊松分布。
当np>5以及nq>5时,二项分布可以转换成正态分布。但是由于正态分布是连续变量,所以需要加一个continuity correction,例如:P(x<=a)--->P(x<a+0.5)。
几何分布(Geometric Distribution):用以描述n次独立的伯努利试验中试验x次才第一次成功的概率。
假如每次伯努利实验成功的概率为p,失败的概率为q=1-p,那么n次独立的伯努利实验中试验x次才第一次成功的概率是:。
几何分布的期望:E(x)=1/p
几何分布的方差:Var(x)=q/p2
超几何分布(Hypergeometric Distribution):用以描述从有限个(N个)物件中抽出n个物件(不放回),其中抽出k个指定种类物件的概率。
假如有N个物品,其中K个是某个特定种类,从这N个物品中抽出n个,其中k个是K种物品的概率是:。
超几何分布的期望:
超几何分布的方差:
最常见的超几何分布问题就是抽取卡牌:一副卡片共有20张,其中6张是红色的,14张是黑色的。从这20张卡片中随机抽取5张,其中4张是红色卡片的概率是多少?
当时,
多项分布(Multinomial Distribution):用以描述n次独立试验中有nx次出现结果x的概率。
伯努利实验每次都只有2个可能的结果,若将其扩展为x个可能的结果,将该独立试验重复n次,那么出现n1次p1,n2次p2,...,nx次px结果的概率是:
其中:
- n是试验的次数
- n1是出现结果1的次数
- n2是出现结果2的次数
- nx是出现结果x的次数
- p1是结果1出现的概率
- p2是结果2出现的概率
- px是结果x出现的概率
- pi>0,p1+p2+...+px=1
最常见的多项分布问题就是多次投骰子:投掷10次均匀的骰子,1次结果是6点,4次结果是4点,5次结果是2点的概率是多少?
多项分布和二项分布的区别在于:二项分布试验每次只有2个结果,而多项分布试验每次可以有多个结果。
均匀分布(Uniform Distribution):随机变量在等长度的区间上取值的概率是相同的。
例如:投掷一颗均匀的骰子,每一面出现的概率都相同。
概率密度函数:(a≤x≤b)
均匀分布的期望:E(X) = (1/2)(a + b)
均匀分布的方差:Var(x) = (1/12)(b-a)2
泊松分布(Poisson Distribution):用以描述在某个时间或空间范围内,某事件发生x次的概率。
其概率质量函数为:。(其中x是在某个时间或空间范围内事件发生的次数,λ是事件发生的平均次数)
泊松分布的期望:λ
泊松分布的方差:λ
最常见的泊松分布问题就是计算单位时间内经过某地的车辆数,或者单位时间内经过某地n辆车的概率。以公交车为例,假设我们知道它过去每个小时平均会5次经过其中一个站点(λ=5),那么它接下来一个小时经过该站点1次,4次,5次,10次的概率分别是多少?
当x=1时:P(1)=e−551/1!≈0.034
当x=4时:P(4)=e−554/4!≈0.175
当x=5时:P(5)=e−555/5!≈0.175
当x=10时:P(10)=e−5510/10!≈0.018
当λ>5时,泊松分布可以转换成正态分布。但是由于正态分布是连续变量,所以需要加一个continuity correction。
指数分布(Exponential Distribution):用以描述泊松过程中随机事件发生的时间间隔的概率。泊松过程即事件以恒定的平均速率连续且独立地发生的过程。
例如:等公交车,两辆车到来的时间间隔,就符合指数分布。
其概率密度函数是:F(x) = λe − λx(x≥0,λ>0)(λ是单位时间事件发生的次数,x是事件发生的时间间隔)
其累积分布函数是:F(x) = 1 − e − λx(x ≥ 0; λ > 0) --- 表示在某个时间间隔内事件发生的概率(如果要表示在某个时间间隔内事件未发生的概率,则用1-F(x)=e − λx)
指数分布的期望:1/λ
指数分布的方差:1/λ2
指数分布主要用于测试产品可靠性。例如:某电视机厂生产的电视机平均10年出现1次大故障,且故障发生的次数服从泊松分布。求该电视机使用15年后还没有出现大故障的概率?
指数分布是无记忆性的。你等待的时间越长,事件发生的概率并不会发生改变。例如:某地发生了一次水灾,那么该地区在接下来一周,或十年以后发生水灾的概率是一样的。
总结如下:
几何分布 | 二项分布 | 指数分布 | 超几何分布 | 泊松分布 | |
概率分布类型 |
离散型概率分布 |
离散型概率分布 |
连续型概率分布 | 离散型概率分布 | 离散型概率分布 |
实验要求 |
|
|
|
|
|
随机变量 | 获得第一次成功的试验次数 | 试验成功的次数 | 事件发生的时间间隔 | 抽取指定种类物件的个数 | 在某个时间或空间范围内,某事件发生的次数 |
概率密度函数 或 概率质量函数 |
F(x) = λe − λx(x≥0,λ>0) | ||||
应用 | 进行n次独立的伯努利试验,求试验x次才第一次成功的概率 | 进行n次独立的伯努利实验,求x次成功的概率 | 已知单位时间内事件发生次数,求一段时间间隔内发生该事件的概率 | 从有限个(N个)物件中抽出n个物件(不放回),求其中抽出k个指定种类物件的概率 | 已知单位时间或空间内某事件发生的平均概率,求一段时间内发生x次该事件的概率或求一段时间内发生该事件的次数 |
常见的概率分布类型(二)(Probability Distribution II)的更多相关文章
- 常见的概率分布类型(Probability Distribution)
统计学中最常见的几种概率分布分别是正态分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribut ...
- paper 115:常见的概率分布(matlab作图)
一.常见的概率分布 表1.1 概率分布分类表 连续随机变量分布 连续统计量分布 离散随机变量分布 分布 分布 二项分布 连续均匀分布 非中心 分布 离散均匀分布 (Gamma)分布 分布 几何分布 指 ...
- ASP.NET MVC 描述类型(二)
ASP.NET MVC 描述类型(二) 前言 上个篇幅中说到ControllerDescriptor类型的由来过程,对于ControllerDescriptor类型来言ActionDescriptor ...
- Android自动化压力测试之Monkey Test Android常见的错误类型及黑白名单的使用方法(四)
Android常见的错误类型有两种 1.ANR类型 1)在5秒内没有响应输入的事件(例如,按键按下,屏幕触摸) 2)BroadcastReceiver在10秒内没有执行完毕 2.Crash类型 1)异 ...
- lintcode:搜索二维矩阵II
题目 搜索二维矩阵 II 写出一个高效的算法来搜索m×n矩阵中的值,返回这个值出现的次数. 这个矩阵具有以下特性: 每行中的整数从左到右是排序的. 每一列的整数从上到下是排序的. 在每一行或每一列中没 ...
- Study notes for Discrete Probability Distribution
The Basics of Probability Probability measures the amount of uncertainty of an event: a fact whose o ...
- Android jni 编程4(对基本类型二维整型数组的操作)
Android jni 编程 对于整型二维数组操作: 类型一:传入二维整型数组,返回一个整型值 类型二:传入二维整型数组,返回一个二维整型数组 声明方法: private native int Sum ...
- 游戏开发中IIS常见支持MIME类型文件解析
游戏开发中IIS常见支持MIME类型文件解析 .apkapplication/vnd.android .ipaapplication/vnd.iphone .csbapplication/octet- ...
- 95. 不同的二叉搜索树 II
95. 不同的二叉搜索树 II 题意 给定一个整数 n,生成所有由 1 ... n 为节点所组成的二叉搜索树. 解题思路 这道题目是基于不同的二叉搜索树进行改进的: 对于连续整数序列[left, ri ...
随机推荐
- sort和sorted
sort 与 sorted 区别: sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作. list 的 sort 方法返回的是对已经存在的列表进行操作,而内建函数 ...
- 云计算入门(一)、使用vagrant+virtualbox安装虚机
一.vagrant和virtaulbox简介 Vagrant是一个基于Ruby的工具,用于创建和部署虚拟化开发环境,我们可以使用它来干如下这些事: 建立和删除虚拟机配置虚拟机运行参数管理虚拟机运行状态 ...
- Caused by: java.lang.ClassCastException: org.springframework.web.SpringServletContainerInitializer cannot be cast to javax.servlet.ServletContainerInitializer。。。。。检查一下servlet-api是否冲突了?
原因:jar包发生冲突.在我的pom.xml文件中 <dependency> <groupId>javax.servlet</groupId> ...
- 深入V8引擎-AST(6)
花了5篇才把一个字符串词法给解析完,不知道要多久才能刷完整个流程,GC.复杂数据类型的V8实现那些估计又是几十篇,天呐,真是给自己挖了个大坑. 前面几篇实际上只是执行了scanner.Initiali ...
- react+umi+netcore+signalR BS和客户端设备 简单通讯
微信扫码登录工作用 仅作记录 扫码访问服务器地址 实现扫码服务器地址通讯中断设备解锁 采用signalR 双向异步通知中断 创建控制器 ChatController 注入集线器上下文 IHubCont ...
- 《EOPL》: 实现了惰性求值的两种参数传递策略
call-by-need 不过是比 call-by-name 多了一个 memorization 的步骤
- 自回归(auto-regression)机制
在每个新单词产生后,该单词就被添加在之前生成的单词序列后面,这个序列会成为模型下一步的新输入.这种机制叫做自回归(auto-regression),同时也是令 RNN 模型效果拔群的重要思想. GPT ...
- 349套HTML5+CSS3各行各业网站模板免费下载
场景 349套HTML5+CSS3各行各业网站模板. Web前端开发是从网页制作演变而来的,名称上有很明显的时代特征.在互联网的演化进程中,网页制作是Web1.0时代产物,那时网站的主要内容是静态的, ...
- Linux实用指令(5)
指定运行级别(系统的制定级别配置文件/etc/inittab): 0:关机 1:单用户(单用户级别root登录不需要密码,进入之后重新设置密码) 2:多用户无网络服务 3:多用户有网络服务 4:系统未 ...
- 小程序开发:用Taro搭建框架
1.node环境 1) 下载 . 官方地址:https://nodejs.org/en/ 或 https://nodejs.org/zh-cn/ 2)安装. 一路next......Install.直 ...