最大似然估计(Maximum Likelihood,ML)
先不要想其他的,首先要在大脑里形成概念!
最大似然估计是什么意思?呵呵,完全不懂字面意思,似然是个啥啊?其实似然是likelihood的文言翻译,就是可能性的意思,所以Maximum Likelihood可以直接叫做最大可能性估计,这就好理解了,就是要求出最大的可能性(下的那个参数)。
一些最基本的概念:总体X,样本x,分布P(x;θ),随机变量(连续、离散),模型参数,联合分布,条件分布
而似然函数在形式上,其实就是样本的联合密度:L(θ)= L(x1,x2,…,xn;θ)= ΠP(xi;θ)称为似然函数。
再读一篇文章,明确最基本的概念:概率与似然(解释的非常通俗易懂)
条件概率:P(A|B)表示在B事件发生的情况下,A事件发生的概率。
先验概率:根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.
后验概率:依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因".
后验概率在实际中一般是很难直接计算出来的,相反先验概率就容易多了。因此一般会利用先验概率来计算后验概率。
可以再看一篇:先验概率、似然函数与后验概率
最近用到的GATK call variation 生成的 gvcf文件里有一行PL,使用的就是 likelihood,所以必须要搞清拟然值到底是什么。
当初研究生时,觉得统计知识无聊,没有好好学,现在要用了,才知道那些都是基础中的基础,基础都不好,后面项目怎么做?
还要捡起大学《概率论》的基础知识
参考资料:
最大似然估计总结笔记 博客园
两篇关于最大似然估计和贝叶斯估计的入门文章 - 博客园 讲得非常好
最大似然估计法 - 文库 大学级别的基础知识,有大学基本例题
基本思想:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大,而不是像最小二乘估计法旨在得到使得模型能最好地拟合样本数据的参数估计量。
作用:用来求一个样本集的相关概率密度函数的参数。
它是总体类型已知条件下,使用的一种参数估计方法。
选择一组参数,使得样品实验结果具有最大的概率。
必须知道总体的分布,离散型还是连续型,分布律,联合分布律,似然函数,极大似然估计值。
求参数最大似然估计步骤:
- 写出样本对应的似然函数;
- 取对数;
- 对各个参数求偏导数,置零;
- 解除每一个参数。
之前学过贝叶斯推断,感觉和最大似然估计很像,两者之间有何区别呢?
极大似然估计和贝叶斯估计 科学网
最大似然估计和贝叶斯参数估计 - 百度文库
----------------------------------------------------------------------------------------
2016年11月17日 补充
搞了这么久,对这些概念还是一脸懵逼。
别人讨论随口就来一个likelihood,随口一个先验、后验,对于我这种没有吃透统计的渣渣来说,真是只能眼睁睁的看着别人装逼了。
所以我一定要搞清楚常见的统计概念。
----------------------------------------------------------------------------------------
先读一篇likelihood的文章:最大似然估计(maximum likelihood estimation)
最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。
用人话来说,就是计算一个模型的参数,使得在该参数、该模型下,样本数据出现的概率最大。(这不就是我纠错的算法吗,那贝叶斯又是什么呢?)
在最简单的情况下,最大似然估计给人类的直觉找到了一个貌似合理的解释。
最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,而其它参数使这个样本出现的概率减小,所以干脆就把这个参数作为估计的真实值。
知乎上的一个问题:最大似然估计和最小二乘法怎么理解?
最大似然估计:现在已经拿到了很多个样本(你的数据集中所有因变量),这些样本值已经实现,最大似然估计就是去找到那个(组)参数估计值,使得前面已经实现的样本值发生概率最大。因为你手头上的样本已经实现了,其发生概率最大才符合逻辑。这时是求样本所有观测的联合概率最大化,是个连乘积,只要取对数,就变成了线性加总。此时通过对参数求导数,并令一阶导数为零,就可以通过解方程(组),得到最大似然估计值。
最小二乘:找到一个(组)估计值,使得实际值与估计值的距离最小。本来用两者差的绝对值汇总并使之最小是最理想的,但绝对值在数学上求最小值比较麻烦,因而替代做法是,找一个(组)估计值,使得实际值与估计值之差的平方加总之后的值最小,称为最小二乘。“二乘”的英文为least square,其实英文的字面意思是“平方最小”。这时,将这个差的平方的和式对参数求导数,并取一阶导数为零,就是OLSE。
隐马尔可夫模型求解三大问题实例剖析(博客有很多相关文章)
最大似然估计(Maximum Likelihood,ML)的更多相关文章
- 最大似然估计 (Maximum Likelihood Estimation), 交叉熵 (Cross Entropy) 与深度神经网络
最近在看深度学习的"花书" (也就是Ian Goodfellow那本了),第五章机器学习基础部分的解释很精华,对比PRML少了很多复杂的推理,比较适合闲暇的时候翻开看看.今天准备写 ...
- 最大似然估计(Maximum likelihood estimation)(通过例子理解)
似然与概率 https://blog.csdn.net/u014182497/article/details/82252456 在统计学中,似然函数(likelihood function,通常简写为 ...
- 最大似然估计(Maximum likelihood estimation)
最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:"模型已定,参数未知".简单而言,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分布,但是该分布的均值与方差 ...
- Maximum Likelihood及Maximum Likelihood Estimation
1.What is Maximum Likelihood? 极大似然是一种找到最可能解释一组观测数据的函数的方法. Maximum Likelihood is a way to find the mo ...
- 机器学习的MLE和MAP:最大似然估计和最大后验估计
https://zhuanlan.zhihu.com/p/32480810 TLDR (or the take away) 频率学派 - Frequentist - Maximum Likelihoo ...
- 最大似然估计实例 | Fitting a Model by Maximum Likelihood (MLE)
参考:Fitting a Model by Maximum Likelihood 最大似然估计是用于估计模型参数的,首先我们必须选定一个模型,然后比对有给定的数据集,然后构建一个联合概率函数,因为给定 ...
- 似然函数 | 最大似然估计 | likelihood | maximum likelihood estimation | R代码
学贝叶斯方法时绕不过去的一个问题,现在系统地总结一下. 之前过于纠结字眼,似然和概率到底有什么区别?以及这一个奇妙的对等关系(其实连续才是f,离散就是p). 似然函数 | 似然值 wiki:在数理统计 ...
- 均匀分布(uniform distribution)期望的最大似然估计(maximum likelihood estimation)
maximum estimator method more known as MLE of a uniform distribution [0,θ] 区间上的均匀分布为例,独立同分布地采样样本 x1, ...
- [转]语音识别中区分性训练(Discriminative Training)和最大似然估计(ML)的区别
转:http://blog.sina.com.cn/s/blog_66f725ba0101bw8i.html 关于语音识别的声学模型训练方法已经是比较成熟的方法,一般企业或者研究机构会采用HTK工具包 ...
随机推荐
- linux lamp服务器安装配置
1 安装Apache服务器 yum -y install httpd httpd-devel 如何查看服务: systemctl | grep httpd 启动apache: service htt ...
- 2016CCPC东北地区大学生程序设计竞赛 1005 HDU5926
链接http://acm.hdu.edu.cn/showproblem.php?pid=5926 题意:给我们一个矩阵,问你根据连连看的玩法可以消去其中的元素 解法:连连看怎么玩,就怎么写,别忘记边界 ...
- ioshittest的用法
昨天,发一个一个BUG.应用了一个第三方控件.一切好,效果出来符合要求. 准备收工时,再次进行测试,发现一个很严重后果的BUG,view上的按钮事件都没了. 经过各种测试,发现就是新引入的第三方控件引 ...
- 新浪微博模拟登陆+数据抓取(java实现)
模拟登陆部分实现: package token.exe; import java.math.BigInteger; import java.util.Random; import org.apache ...
- PM(Project Manager):系列博客
http://blog.csdn.net/MoreeVan/article/list/2
- ContentProvider官方教程(6)provider支持的数据类型
Provider Data Types Content providers can offer many different data types. The User Dictionary Provi ...
- word2007
word2007 word2007图标 word2007边框和底纹 word2007扫描图片 word2007剪贴画 word2007图片 word2007页面视图 w ...
- 【leetcode❤python】Binary Watch
#-*- coding: UTF-8 -*- from itertools import combinationsclass Solution(object): hourList=[8, ...
- BZOJ 2568 比特集合
题目链接:http://www.lydsy.com:808/JudgeOnline/problem.php?id=2568 题意:维护一个集合S,支持以下操作: (1)INS M : 将元素 M 插入 ...
- N年后给自己一些忠诚的建议
给自己S年后的一封信: 也许,现在的自己已经经历了种种历练,或成为干将,许是拔杆而起的创业者,再者仍然是一名奋斗中的工薪族.无论现在如何,请记得: M年前,自己坐在小房子里写下的信件. 那时候,自己是 ...