Lecture5_1&5_2.随机变量的数字特征(数学期望、方差、协方差)
一、数学期望
1.离散型随机变量的数学期望
设X为离散随机变量,其概率分布为:P(X=xk)=pk
若无穷级数$\sum_{k=1}^{+\infty}x_kp_k$绝对收敛
(即满足$\sum_{k=1}^{+\infty}|x_kp_k|$收敛)
则称其为X的数学期望,记作$E(X)=\sum_{k=1}^{+\infty}x_kp_k$
二项分布,X~B(n,p),E(X)=np
泊松分布,X~P(λ),E(X)=λ
超几何分布,X~H(N,M,n),E(X)=nM/N
几何分布,X~GE(p),E(X)=1/p
2.连续型随机变量的数学期望
设连续型随机变量X的概率密度为f(x)
若广义积分$\int_{-\infty}^{+\infty}xf(x)dx$绝对收敛
则称此积分为X的数学期望
$E(X)=\int_{-\infty}^{+\infty}xf(x)dx$
均匀分布,X~U[a,b],E(X)=(a+b)/2
指数分布,X~E(λ),E(X)=1/λ
正态分布,X~N(μ,σ2),E(X)=μ
卡方分布,X~Γ(α,β),E(X)=α/β
3.随机变量函数Y的数学期望
Y=g(X)
离散型,$E(Y)=\sum_{i=1}^{+\infty}g(x_i)p_i$
连续型,$E(Y)=\int_{-\infty}^{+\infty}g(x)f(x)$
Z=φ(X1,...,Xn)
$E(Z)=\int_{-\infty}^{+infty}...\int_{-\infty}^{+\infty}\varphi(x_1,x_2,...,x_n)f(x_1,x_2,...,x_n)dx_1dx_2...dx_n$
4.数学期望的性质
设a,ai,C为常数
(1)E(C)=C
(2)E(aX)=aE(X)
(3)E(X+Y)=E(X)+E(Y)
(4)X,Y独立->E(XY)=E(X)E(Y)
逆命题不成立,可推广到n个独立随机变量
(5)若存在数a使得P(X≥a)=1,则E(X)≥a
(6)[E(XY)]2≤E(X2)(Y2),许瓦尔兹不等式
二、方差
1.方差的定义
若E[X-E(X)]2存在,则称其随机变量X的方差,记为D(X)或Var(X),即:
D(X)=E[X-E(X)]2
称$σ=\sqrt{D(X)}$为X的均方差或标准差
【方差描述随机变量 X 的取值偏离其平均水平的平均偏离程度,从而刻划了X 可能取值的分散程度】
2.
离散型随机变量的方差:$D(X)=\sum_{k=1}^{+\infty}(x-E(X))^2p_k$
连续型随机变量的方差:$D(X)=\int_{-\infty}^{+\infty}(x-E(X))^2f(x)dx$
计算方差常用公式:D(X)=E(X2)-E2(X)
证:D(X)=E[(X-EX)2]=E[X2-2XEX+(EX)2]=E(X2)-E(2XEX)+E[(EX)2]=E(X2)-2(EX)2+(EX)2=E(X2)-(EX)2
0-1分布,D(X)=pq
二项分布,D(X)=npq
泊松分布,D(X)=λ
几何分布,D(X)=q/p2
均匀分布,D(X)=(b-a)2/12
指数分布,D(X)=1/λ2
正态分布,D(X)=σ2
Γ分布,D(X)=α/β2
3.方差的性质:
(1)D(C)=0
(2)D(aX)=a2D(X)
D(aX+b)=a2D(X)
(3)D(X±Y)=D(X)+D(Y)±2E((X-E(X))(Y-E(Y))
特别地,若X,Y相互独立,则D(X+Y)=D(X)+D(Y),反之不成立
(4)若X1,...,Xn相互独立,a1,a2,...,an,b为常数
则$D\left(\sum_{i=1}^{n}a_iX_i+b\right)=\sum_{i=1}^{n}a_i^2D(X_i)$
(5)对任意常数C,D(X)≤E(X-C)2,当且仅当C=E(X)时,等号成立
(6)D(X)=0 <==> P(X=E(X))=1
即X服从单点分布
切尔雪夫不等式:对随机变量X,设E(X),D(X)存在,则对任意ε>0:
P{|X-E(X)|≥ε}≤$\frac{D(X)}{\varepsilon^2}$
注:
(1)不是所有的随机变量都有数学期望和方差
(2)数学期望和方差不能确定分布
(3)已知分布类型,数学期望和方差的情况下,可完全确定分布
4.偏度系数,峰度系数,分位数,中位数,变异系数
设随机变量X,a和p(0<p<1),若下式成立
P(X≤a)≥p≥P(X<a)
则称a为X的p分位数,记为xp=a
0.5分位数又称为X的中位数,记位med(X)
p分位数一定存在,但不唯一
当X为连续随机变量时,p分位数通常存在且唯一,可(重新)定义分位数如下:
设连续随机变量X的概率分布密度为f(x),0<p<1.若xp使得
P(X≤xp)=p
即$\int_{-\infty}^{x_p}f(x)dx=p$
则称xp为X的p分位数,该分位数又称下侧分位数(左)
上侧分位数(右):
若xα使得P(X>xα)=α
即$\int_{x_\alpha}^{+\infty}f(x)dx=\alpha$
三、协方差与相关系数
1.协方差的定义
对二维随机变量(X,Y),若E([X-E(X)][Y-E(Y)])存在,称其为二维随机变量(X,Y)的协方差,记为
cov(X,Y)=E((X-E(X)(Y-E(Y)))
2.协方差的性质
(1)cov(X,Y)=cov(Y,X)=E(XY)-E(X)E(Y)
(2)cov(X,X)=D(X)
(3)cov(a1X+b1,a2Y+b2)=a1a2cov(X,Y),其中a1,b1,a2,b2为常数
(4)cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)
(5)D(X±Y)=D(X)+D(Y)±2cov(X,Y)
(6)|cov(X,Y)|2≤D(X)D(Y)
3.随机变量的标准化
设随机变量X的期望E(X)、方差D(X)都存在,且D(X)≠0,则称
$X*=\frac{X-E(X)}{\sqrt{D(X)}}$
为X的标准化随机变量.易见,
E(X*)=0,D(X*)=1
4.相关系数的定义
对二维随机变量(X ,Y),若其协方差存在,且D(X)>0,D(Y)>0,则称
$E\left(\frac{(X-E(X))(Y-E(Y))}{\sqrt{D(X)}\sqrt{D(Y)}}\right)=\frac{cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$
为X,Y的相关系数,记为ρXY=cov(X*,Y*)
若ρXY=0,则称X,Y(线性)不相关<==>cov(X,Y)=0<==>E(XY)=E(X)E(Y)<==>D(X±Y)=D(X)+D(Y)
(注:独立一定不相关,不相关不一定独立。若(X,Y)服从二维正态分布,则等价)
若ρXY=1,则X,Y有线性相关的概率为1<==>存在常数a,b,且a≠0,使得P(Y=aX+b)=1
5.协方差矩阵
称
$$
\left[
\begin{matrix}
D(X) & cov(X,Y) \\
cov(Y,X) & D(Y)
\end{matrix}
\right]
$$
为二维随机变量(X,Y)的协方差矩阵
n维随机变量的协方差矩阵
设n维随机变量(X1,X2,...,Xn),记σij=cov(Xi,Xj),若σij都存在,则称
$$
\left[
\begin{matrix}
\sigma_{11} & \sigma_{12} & \cdots & \sigma_{1n} \\
\sigma_{21} & \sigma_{22} & \cdots & \sigma_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
\sigma_{n1} & \sigma_{n2} & \cdots & \sigma_{nn} \\
\end{matrix}
\right]
$$
为(X1,X2,...,Xn)的协方差矩阵
性质:(1)对称非负定(2)σii=DXi(3)$\sigma_{ij}^2<\sigma_{ii}\sigma_{jj}$
【博客园使用latex块级元素,无行距】
Lecture5_1&5_2.随机变量的数字特征(数学期望、方差、协方差)的更多相关文章
- R语言结合概率统计的体系分析---数字特征
现在有一个人,如何对这个人怎么识别这个人?那么就对其存在的特征进行提取,比如,提取其身高,其相貌,其年龄,分析这些特征,从而确定了,这个人就是这个人,我们绝不会认错. 同理,对数据进行分析,也是提取出 ...
- 【HDU4652】Dice(数学期望,动态规划)
[HDU4652]Dice(数学期望,动态规划) 题面 Vjudge 有一个\(m\)面骰子 询问,连续出现\(n\)个相同的时候停止的期望 连续出现\(n\)个不同的时候停止的期望 题解 考虑两种分 ...
- k阶原点距和k阶中心距各是说明什么数字特征
k阶原点距和k阶中心距各是说明什么数字特征 二阶中心距,也叫作方差,它告诉我们一个随机变量在它均值附近波动的大小,方差越大,波动性越大.方差也相当于机械运动中以重心为转轴的转动惯量.(The mome ...
- 【区间dp+组合数+数学期望】Expression
https://www.bnuoj.com/v3/contest_show.php?cid=9148#problem/I [题意] 给定n个操作数和n-1个操作符,组成一个数学式子.每次可以选择两个相 ...
- [BZOJ 3143][HNOI2013]游走(数学期望)
题目:http://www.lydsy.com:808/JudgeOnline/problem.php?id=3143 分析: 易得如果知道了每条边经过的数学期望,那就可以贪心着按每条边的期望的大小赋 ...
- Codeforces Round #259 (Div. 2) C - Little Pony and Expected Maximum (数学期望)
题目链接 题意 : 一个m面的骰子,掷n次,问得到最大值的期望. 思路 : 数学期望,离散时的公式是E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) p(xi)的是 ...
- 数学期望和概率DP题目泛做(为了对应AD的课件)
题1: Uva 1636 Headshot 题目大意: 给出一个000111序列,注意实际上是环状的.问是0出现的概率大,还是当前是0,下一个还是0的概率大. 问题比较简单,注意比较大小: A/C & ...
- [2013山东ACM]省赛 The number of steps (可能DP,数学期望)
The number of steps nid=24#time" style="padding-bottom:0px; margin:0px; padding-left:0px; ...
- 【BZOJ2134】单位错选(数学期望,动态规划)
[BZOJ2134]单位错选(数学期望,动态规划) 题面 BZOJ 题解 单独考虑相邻的两道题目的概率就好了 没了呀.. #include<iostream> #include<cs ...
随机推荐
- 如何使用多数据源,同时使用jpa和jdbctemplate
spring: datasource: first: type: com.alibaba.druid.pool.DruidDataSource url: jdbc:mysql://xx.xx.xx.x ...
- js中精度问题以及解决方案
js中的数字按照IEEE 754的标准,使用64位双精度浮点型来表示.其中符号位S,指数位E,尾数位M分别占了1,11,52位,并且在ES5规范中指出了指数位E的取值范围是[-1074, 971]. ...
- day 17 - 1 递归函数
递归函数 什么是递归 了解什么是递归 : 在函数中调用自身函数 最大递归深度默认是 997/998 —— 是 python 从内存角度出发做得限制 能看懂递归 能知道递归的应用场景 初识递归 —— 二 ...
- Django之Xadmin
零.预备知识 单例对象 方式一:__new__方法 方式二:模块导入,只要在引入的文件中实例了这个对象,不管引道哪里,这个对象都指向同一个内存空间 class My_singleton(object) ...
- torch分类问题
import torch from torch.autograd import Variable import torch.nn.functional as F import matplotlib.p ...
- Linux内核 设备树操作常用API【转】
转自:https://www.linuxidc.com/Linux/2017-02/140818.htm 一文中介绍了设备树的语法,这里主要介绍内核中提供的操作设备树的API,这些API通常都在&qu ...
- ubuntu 16.04系统下解决MySQL 5.7版本的root用户重置密码问题
最近在ubuntu系统上安装了MySQL,但是安装时没有提示输入root用户密码,在网上找了一天解决方案,试图修改root用户下的登入密码,但是网上的帖子都不凑效,最后终于改成功了,因此记下来以供有同 ...
- MySQL基本操作练习
-- 数据的准备 -- 创建一个数据库 create database python_test charset=utf8; -- 使用一个数据库 use python_test; -- 显示使用的当前 ...
- tensorflow添加层-【老鱼学tensorflow】
本节主要定义个添加层的函数,在深度学习中是通过创建多层神经网络来实现的,因此添加层的函数会被经常用到: import tensorflow as tf def add_layer(inputs, in ...
- python下载大文件
1. wget def download_big_file_with_wget(url, target_file_name): """ 使用wget下载大文件 Note: ...