[TOC]
更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/

极大似然估计

一、最大似然原理

二、极大似然估计

极大似然估计是建立在最大似然原理的基础上的一个统计方法。极大似然估计提供了一种给定观察数据来评估模型参数的方法，即“模型已定，参数未知”。通过观察若干次实验的结果，利用实验结果得到某个参数值能够使样本出现的概率最大，则称为极大似然估计。

简而言之，极大似然估计的目的是利用已知的样本结果，反推最有可能导致这样结果的参数值。

三、似然函数

假设一个样本集$D$的$n$个样本都是独立同分布的，并且该样本集为

\[
D={x_1,x_2,\ldots,x_n}
\]

似然函数（likelihood function）：联合概率密度函数$p(D|\theta)$称为相对于${x_1,x_2,\ldots,x_n}$的$\theta$的似然函数。

\[
l(\theta) = p(D|\theta) = p(x_1,x_2,\ldots,x_n|\theta) = \prod_{i=1}^n p(x_i|\theta)
\]

四、极大似然函数估计值

如果$\hat{\theta}$是$\theta$参数空间中能使似然函数$l(\theta)$最大的$\theta$值，则$\hat{\theta}$是最可能的参数值，那么$\hat{\theta}$是$\theta$的最大似然估计量，记作

\[
\hat{\theta} = d(x_1,x_2,\ldots,x_n) = d(D)
\]

并且$\hat{\theta}(x_1,x_2,\ldots,x_n)$称作极大似然函数估计值。

五、求解极大似然函数

给出求解最大$\theta$值的公式

\[
\hat{\theta} = arg \underbrace{max}_\theta l(\theta) = arg \underbrace{max}_\theta \prod_{i=1}^n p(x_i|\theta)
\]

为了方便计算，定义对数似然函数$H(\theta)$，即对似然函数求对数

\[
H(\theta) = \ln{l(\theta)}
\]

因此求最大$\theta$值的公式变成了

\[
\hat{\theta} = arg \underbrace{max}_\theta H(\theta) = arg \underbrace{max}_\theta \ln{l(\theta)} = arg \underbrace{max}_\theta \prod_{i=1}^n \ln{p(x_i|\theta)}
\]

并且可以发现公式中只有一个变量$\theta$

5.1 未知参数只有一个

如果$\theta$为标量，在似然函数满足连续、可微的情况下，则极大似然估计量是下面微分方程的解

\[
{\frac{dH(\theta)}{d\theta}} = {\frac{d\ln{l(\theta)}}{d\theta}} = 0
\]

5.2 位置参数有多个

如果$\theta$为$k$维向量，可以把$\theta$记作$\theta = [\theta_1,\theta_2,\ldots,\theta_k]^T$，对$\theta_1,\theta_2,\ldots,\theta_k$求梯度，可得

\[
\Delta_\theta=[{\frac{\partial}{\partial_{\theta_1}}},{\frac{\partial}{\partial_{\theta_2}}},\cdots,{\frac{\partial}{\partial_{\theta_s}}}]^T
\]

如果似然函数满足连续、可导的情况下，则最大似然估计量就是如下方程的解：

\[
\Delta_\theta{H(\theta)} = \Delta_\theta\ln{l(\theta)} = \sum_{i=1}^n \Delta_\theta \ln(p(x_i|\theta)) = 0
\]

5.3 总结

方程的解只是一个估计值，只有在样本趋于无限多的时候，才会逐渐接近真实值。

B-概率论-极大似然估计的更多相关文章

【ML数学知识】极大似然估计
它是建立在极大似然原理的基础上的一个统计方法,极大似然原理的直观想法是,一个随机试验如有若干个可能的结果A,B,C,... ,若在一次试验中,结果A出现了,那么可以认为实验条件对A的出现有利,也即出现 ...
LR为什么用极大似然估计，损失函数为什么是log损失函数（交叉熵）
首先,逻辑回归是一个概率模型,不管x取什么值,最后模型的输出也是固定在(0,1)之间,这样就可以代表x取某个值时y是1的概率这里边的参数就是θ,我们估计参数的时候常用的就是极大似然估计,为什么呢?可 ...
极大似然估计MLE 极大后验概率估计MAP
https://www.cnblogs.com/sylvanas2012/p/5058065.html 写的贼好 http://www.cnblogs.com/washa/p/3222109.html ...
[白话解析] 深入浅出极大似然估计 & 极大后验概率估计
[白话解析] 深入浅出极大似然估计 & 极大后验概率估计 0x00 摘要本文在少用数学公式的情况下,尽量仅依靠感性直觉的思考来讲解极大似然估计 & 极大后验概率估计,并且从名著中找 ...
极大既然估计和高斯分布推导最小二乘、LASSO、Ridge回归
最小二乘法可以从Cost/Loss function角度去想,这是统计(机器)学习里面一个重要概念,一般建立模型就是让loss function最小,而最小二乘法可以认为是 loss function ...
参数估计：最大似然估计MLE
http://blog.csdn.net/pipisorry/article/details/51461997 最大似然估计MLE 顾名思义,当然是要找到一个参数,使得L最大,为什么要使得它最大呢,因 ...
【MLE】最大似然估计Maximum Likelihood Estimation
模型已定,参数未知已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值.最大似然估计是建立在这样的思想上:已知某个参数能使这个 ...
ML 徒手系列最大似然估计
1.最大似然估计数学定义: 假设总体分布为f(x,θ),X1,X2...Xn为总体采样得到的样本.其中X1,X2...Xn独立同分布,可求得样本的联合概率密度函数为: 其中θ是需要求得的未知量,xi是 ...
又看了一次EM 算法，还有高斯混合模型，最大似然估计
先列明材料: 高斯混合模型的推导计算(英文版): http://www.seanborman.com/publications/EM_algorithm.pdf 这位翻译写成中文版: http://w ...

随机推荐

201871010134-周英杰《面向对象程序设计（java）》第一周学习总结
项目内容 java https://www.cnblogs.com/nwnu-daizh/ 任课老师博客下 https://www.cnblogs.com/nwnu-daizh/p/11435127 ...
buuctf 随便注 writeup
1.0 打开页面显然这个题的考点是注入,那我们来测一下 2.0 sql注入测试 1 2 输入 1' 后发现没有回显,改为 1' --+ 后,有回显,应该在这存在注入点试一下 1' and 1=1 ...
关闭Linux(Ubuntu)错误报告
关于错误报告网上查了下,Ubuntu(包括elementary,elementary是基于Ubuntu的)桌面版预装了Apport,它是一个错误收集系统,会收集软件崩溃.未处理异常和其他,包括程序b ...
Linux基础提高_sudo，行为审计，跳板机
sudo 临时给普通用户赋予root权限的一种方式 echo "%wheel ALL=(ALL) NOPASSWD: ALL" >>/etc/ ...
spring security jquery ajax重定向问题解决
服务器端security增加一个配置如下: @Override protected void configure(HttpSecurity http) throws Exception { Strin ...
VSTO之WPF和Winform弹窗
写插件弹窗是肯定要有的,有弹窗才有展示功能的页面啊! 记录一下前段时间遇到的一些弹窗方面的坑,一个个踩过来也是收获颇丰啊! WPF弹窗最简单的弹窗方式,new一个窗体,然后调用Show方法. Win ...
FreeSql （三十）读写分离
FreeSql 支持数据库读写分离,本功能是客户端的读写分离行为,数据库服务器该怎么配置仍然那样配置,不受本功能影响,为了方便描术后面讲到的[读写分离]都是指客户端的功能支持. 各种数据库的读写方案不 ...
Hive函数大全-完整版
现在虽然有很多SQL ON Hadoop的解决方案,像Spark SQL.Impala.Presto等等,但就目前来看,在基于Hadoop的大数据分析平台.数据仓库中,Hive仍然是不可替代的角色.尽 ...
spring scope prototype与singleton区别
1.singleton作用域当一个bean的作用域设置为singleton, 那么Spring IOC容器中只会存在一个共享的bean实例,并且所有对bean的请求,只要id与该bean定义相匹配 ...
Hola！
个人资料我叫Xenny,当然我还有很多名字,Tony.LTY.唐梦寒.soar.tafhack等等,这些都是我的昵称:但是用的最多的还是Xenny. Xenny的来历很扯,Xen是因为从XD中取了个 ...

B-概率论-极大似然估计