最大似然估计(Maximum Likelihood,ML)
先不要想其他的,首先要在大脑里形成概念!
最大似然估计是什么意思?呵呵,完全不懂字面意思,似然是个啥啊?其实似然是likelihood的文言翻译,就是可能性的意思,所以Maximum Likelihood可以直接叫做最大可能性估计,这就好理解了,就是要求出最大的可能性(下的那个参数)。
一些最基本的概念:总体X,样本x,分布P(x;θ),随机变量(连续、离散),模型参数,联合分布,条件分布
而似然函数在形式上,其实就是样本的联合密度:L(θ)= L(x1,x2,…,xn;θ)= ΠP(xi;θ)称为似然函数。
再读一篇文章,明确最基本的概念:概率与似然(解释的非常通俗易懂)
条件概率:P(A|B)表示在B事件发生的情况下,A事件发生的概率。
先验概率:根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.
后验概率:依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因".
后验概率在实际中一般是很难直接计算出来的,相反先验概率就容易多了。因此一般会利用先验概率来计算后验概率。
可以再看一篇:先验概率、似然函数与后验概率
最近用到的GATK call variation 生成的 gvcf文件里有一行PL,使用的就是 likelihood,所以必须要搞清拟然值到底是什么。
当初研究生时,觉得统计知识无聊,没有好好学,现在要用了,才知道那些都是基础中的基础,基础都不好,后面项目怎么做?
还要捡起大学《概率论》的基础知识
参考资料:
最大似然估计总结笔记 博客园
两篇关于最大似然估计和贝叶斯估计的入门文章 - 博客园 讲得非常好
最大似然估计法 - 文库 大学级别的基础知识,有大学基本例题
基本思想:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大,而不是像最小二乘估计法旨在得到使得模型能最好地拟合样本数据的参数估计量。
作用:用来求一个样本集的相关概率密度函数的参数。
它是总体类型已知条件下,使用的一种参数估计方法。
选择一组参数,使得样品实验结果具有最大的概率。
必须知道总体的分布,离散型还是连续型,分布律,联合分布律,似然函数,极大似然估计值。
求参数最大似然估计步骤:
- 写出样本对应的似然函数;
- 取对数;
- 对各个参数求偏导数,置零;
- 解除每一个参数。
之前学过贝叶斯推断,感觉和最大似然估计很像,两者之间有何区别呢?
极大似然估计和贝叶斯估计 科学网
最大似然估计和贝叶斯参数估计 - 百度文库
----------------------------------------------------------------------------------------
2016年11月17日 补充
搞了这么久,对这些概念还是一脸懵逼。
别人讨论随口就来一个likelihood,随口一个先验、后验,对于我这种没有吃透统计的渣渣来说,真是只能眼睁睁的看着别人装逼了。
所以我一定要搞清楚常见的统计概念。
----------------------------------------------------------------------------------------
先读一篇likelihood的文章:最大似然估计(maximum likelihood estimation)
最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。
用人话来说,就是计算一个模型的参数,使得在该参数、该模型下,样本数据出现的概率最大。(这不就是我纠错的算法吗,那贝叶斯又是什么呢?)
在最简单的情况下,最大似然估计给人类的直觉找到了一个貌似合理的解释。
最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,而其它参数使这个样本出现的概率减小,所以干脆就把这个参数作为估计的真实值。
知乎上的一个问题:最大似然估计和最小二乘法怎么理解?
最大似然估计:现在已经拿到了很多个样本(你的数据集中所有因变量),这些样本值已经实现,最大似然估计就是去找到那个(组)参数估计值,使得前面已经实现的样本值发生概率最大。因为你手头上的样本已经实现了,其发生概率最大才符合逻辑。这时是求样本所有观测的联合概率最大化,是个连乘积,只要取对数,就变成了线性加总。此时通过对参数求导数,并令一阶导数为零,就可以通过解方程(组),得到最大似然估计值。
最小二乘:找到一个(组)估计值,使得实际值与估计值的距离最小。本来用两者差的绝对值汇总并使之最小是最理想的,但绝对值在数学上求最小值比较麻烦,因而替代做法是,找一个(组)估计值,使得实际值与估计值之差的平方加总之后的值最小,称为最小二乘。“二乘”的英文为least square,其实英文的字面意思是“平方最小”。这时,将这个差的平方的和式对参数求导数,并取一阶导数为零,就是OLSE。
隐马尔可夫模型求解三大问题实例剖析(博客有很多相关文章)
最大似然估计(Maximum Likelihood,ML)的更多相关文章
- 最大似然估计 (Maximum Likelihood Estimation), 交叉熵 (Cross Entropy) 与深度神经网络
最近在看深度学习的"花书" (也就是Ian Goodfellow那本了),第五章机器学习基础部分的解释很精华,对比PRML少了很多复杂的推理,比较适合闲暇的时候翻开看看.今天准备写 ...
- 最大似然估计(Maximum likelihood estimation)(通过例子理解)
似然与概率 https://blog.csdn.net/u014182497/article/details/82252456 在统计学中,似然函数(likelihood function,通常简写为 ...
- 最大似然估计(Maximum likelihood estimation)
最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:"模型已定,参数未知".简单而言,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分布,但是该分布的均值与方差 ...
- Maximum Likelihood及Maximum Likelihood Estimation
1.What is Maximum Likelihood? 极大似然是一种找到最可能解释一组观测数据的函数的方法. Maximum Likelihood is a way to find the mo ...
- 机器学习的MLE和MAP:最大似然估计和最大后验估计
https://zhuanlan.zhihu.com/p/32480810 TLDR (or the take away) 频率学派 - Frequentist - Maximum Likelihoo ...
- 最大似然估计实例 | Fitting a Model by Maximum Likelihood (MLE)
参考:Fitting a Model by Maximum Likelihood 最大似然估计是用于估计模型参数的,首先我们必须选定一个模型,然后比对有给定的数据集,然后构建一个联合概率函数,因为给定 ...
- 似然函数 | 最大似然估计 | likelihood | maximum likelihood estimation | R代码
学贝叶斯方法时绕不过去的一个问题,现在系统地总结一下. 之前过于纠结字眼,似然和概率到底有什么区别?以及这一个奇妙的对等关系(其实连续才是f,离散就是p). 似然函数 | 似然值 wiki:在数理统计 ...
- 均匀分布(uniform distribution)期望的最大似然估计(maximum likelihood estimation)
maximum estimator method more known as MLE of a uniform distribution [0,θ] 区间上的均匀分布为例,独立同分布地采样样本 x1, ...
- [转]语音识别中区分性训练(Discriminative Training)和最大似然估计(ML)的区别
转:http://blog.sina.com.cn/s/blog_66f725ba0101bw8i.html 关于语音识别的声学模型训练方法已经是比较成熟的方法,一般企业或者研究机构会采用HTK工具包 ...
随机推荐
- FlexCell控件的使用
private void grid1_GetCellText(object Sender, FlexCell.Grid.GetCellTextEventArgs e) { // 要使用虚表,可以在Gr ...
- C语言中的指针数组
C语言中的指针数组是什么,像 char *a[]={"ddd","dsidd","lll"}; 这里讲一下注意如果我们使用了a也就是首元素的 ...
- BZOJ 1061 志愿者招募(最小费用最大流)
题目链接:http://61.187.179.132/JudgeOnline/problem.php?id=1061 题意:申奥成功后,布布经过不懈努力,终于 成为奥组委下属公司人力资源部门的主管.布 ...
- SQLite Databases 数据存储
SQLite Databases数据存储 使用 推荐xutils dbutil package com.practicezx.jishibang.sqlite; import java.io.File ...
- 【转载】跟着9张思维导图学习JavaScript
原文:跟着9张思维导图学习JavaScript 学习的道路就是要不断的总结归纳,好记性不如烂笔头,so,下面将 po 出我收集的 9 张 JavaScript相关的思维导图(非原创). 思维导图小ti ...
- Django Models的数据类型
Django中的页面管理后台 Djano中自带admin后台管理模块,可以通过web页面去管理,有点想php-admin,使用步骤: 在项目中models.py 中创建数据库表 class useri ...
- I2C总线信号时序总结
I2C总线信号时序总结 总线空闲状态 I2C总线总线的SDA和SCL两条信号线同时处于高电平时,规定为总线的空闲状态.此时各个器件的输出级场效应管均处在截止状态,即释放总线,由两条信号线各自的上拉电 ...
- WrapPanel流布局的一个简单例子
<Window x:Class="WrapPanel.MainWindow" xmlns="http://schemas.microsoft.com/winfx/2 ...
- android tablelayout 显示图片
当在tablelayout中显示图片时,设置imageView为固定大小时,会出现divide by zero 错误 将LayoutParams 改为 TableRow.LayoutParams即可 ...
- 直播未来属于RTMP还是HTTP?
直播未来属于RTMP还是HTTP? HTTP 传视频比 RTMP 实现起来简单?HTTP 延迟太高? 答:直播通讯未来是属于html5的. 1,协议使用份额 如今国内90%的面向大众的直播平台都是采用 ...