声明：

1，本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结，不得用作商用。欢迎转载，但请注明出处（即：本帖地址）。

2，因为本人在学习初始时有非常多数学知识都已忘记。所以为了弄懂当中的内容查阅了非常多资料，所以里面应该会有引用其它帖子的小部分内容，假设原作者看到能够私信我，我会将您的帖子的地址付到以下。

3。假设有内容错误或不准确欢迎大家指正。

4。假设能帮到你，那真是太好了。

IIS的推导过程

IIS是一种最大熵学习模型的最优化算法。其推导步骤例如以下：

目标是通过极大似然预计学习模型參数求对数似然函数的极大值。

IIS的想法是：如果最大熵模型当前的參数向量是λ = (λ1, λ2, …, λn)^T，我们希望找到一个新的參数向量λ +
δ= (λ1+δ1, λ2+δ2, …, λn+δn)^T。使得模型的对数似然函数值增大。假设能有这样一种參数向量更新的方法F：λ ->λ+δ，那么就能够反复使用这一方法，直至找到对数似然函数的最大值。

对于给定的经验分布，模型參数从λ到λ+δ，对数似然函数的该变量是

PS：上面 >= 的推导是依据不定时：-loga >= 1 - a， a > 0

将上述求得的结果(最后一行)记为A(δ| λ)，于是有：

L( λ+ δ ) – L( λ ) >= A(δ | λ)

为了进一步减少这个下界，即缩小A(δ | λ)。引入一个变量：

由于fi是二值函数，故f^#(x,y)表示的是全部特征(x, y)出现的次数，然后利用Jason不等式，可得：

我们把上述式子求得的A(δ | λ)的下界记为B(δ | λ)，即：

相当于B(δ | λ)是对数似然函数添加量的一个新的下界，可记作：L(λ+δ)-L(λ) >= B(δ | λ)。

接下来，对B(δ| λ)求偏导，得：

此时得到的偏导结果仅仅含δ，除δ之外不再含其他变量，令其为0，可得：

从而求得δ，问题得解。

IIS算法描写叙述

输入：

特征函数f1, f2, …,fn；经验分布，模型P_λ(y|x)

输出：

最优參数值λ_i^*。最优模型P_λ。

解：

1，对全部i∈{1, 2, …, n}。取初值λi = 0

2，对每一i∈{1, 2, …, n}：

a)令δi是例如以下方程(这里将其称作方程一)

的解，这里：

b)更新λi的值：λi <- λi + δi

3，假设不是全部λi都收敛，则反复步骤2。

这一算法的关键步骤是a)。即求解a)中方程的δi。

假设f^#(x, y) 是常数。即对不论什么x, y。有f^#(x,y) = M，那么δi能够显示的表示成：

假设f^#(x, y) 不是常数，那么必须通过数值计算求δi，而简单有效的方法是牛顿法。以g(δi) = 0，表示上面的方程一，牛顿法通过迭代求的δi，使得g(δi^*)= 0。迭代公式是：

求得了δ。便相当于求得权值λ，终于将λ 回代到下式中：

即得到最大熵模型的最优预计。

參考：

http://blog.csdn.net/v_july_v/article/details/40508465?

utm_source=tuicool&utm_medium=referral

逻辑斯蒂回归3 -- 最大熵模型之改进的迭代尺度法(IIS)的更多相关文章

【分类器】感知机+线性回归+逻辑斯蒂回归+softmax回归
一.感知机详细参考:https://blog.csdn.net/wodeai1235/article/details/54755735 1.模型和图像: 2.数学定义推导和优化: 3.流程 ...
【转】机器学习笔记之（3）——Logistic回归（逻辑斯蒂回归）
原文链接:https://blog.csdn.net/gwplovekimi/article/details/80288964 本博文为逻辑斯特回归的学习笔记.由于仅仅是学习笔记,水平有限,还望广大读 ...
机器学习之LinearRegression与Logistic Regression逻辑斯蒂回归(三)
一评价尺度 sklearn包含四种评价尺度 1 均方差(mean-squared-error) 2 平均绝对值误差(mean_absolute_error) 3 可释方差得分(explained_v ...
spark机器学习从0到1逻辑斯蒂回归之(四）
逻辑斯蒂回归一.概念逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的,也可以是多分类的.logis ...
python机器学习实现逻辑斯蒂回归
逻辑斯蒂回归关注公众号"轻松学编程"了解更多. [关键词]Logistics函数,最大似然估计,梯度下降法 1.Logistics回归的原理利用Logistics回归进行分类的 ...
【项目实战】pytorch实现逻辑斯蒂回归
视频指导:https://www.bilibili.com/video/BV1Y7411d7Ys?p=6 一些数据集在pytorch框架下,里面面有配套的数据集,pytorch里面有一个torchv ...
[置顶] 局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法——斯坦福ML公开课笔记3
转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9113681 最近在看Ng的机器学习公开课,Ng的讲法循循善诱,感觉提高了不少 ...
【TensorFlow入门完全指南】模型篇·逻辑斯蒂回归模型
import库,加载mnist数据集. 设置学习率,迭代次数,batch并行计算数量,以及log显示. 这里设置了占位符,输入是batch * 784的矩阵,由于是并行计算,所以None实际上代表并行 ...
逻辑斯蒂回归（Logistic Regression）
逻辑回归名字比较古怪,看上去是回归,却是一个简单的二分类模型. 逻辑回归的模型是如下形式: 其中x是features,θ是feature的权重,σ是sigmoid函数.将θ0视为θ0*x0(x0取值为 ...

随机推荐

React-Native 踩坑过程
踩坑过程: 解决方法就是去 SDK Manager 把 23.0.1 的版本下载了而如果报错信息中含有bintray.com.gradle.org等网址,请***,反复重试,或者去react nat ...
aspectC++常用命令
常用命令:1.ag++ main.cc //在工程目录下产生编译后的exe2.ag++ main.cc --weave_only //产生.acc 纯c++文件3.ag++ main.cc --gen ...
poj3233Matrix Power Series(矩阵乘法)
Matrix Power Series Time Limit: 3000MS Memory Limit: 131072K Total Submissions: 23187 Accepted: ...
Django day08 多表操作 (一) 多表模型创建
多表模型创建分析:1)作者表:一个作者有姓名和年龄2)作者信息表: 有作者就有信息,点击作者的名字可以查询他的电话和地址, 作者表对应作者信息表,所以他们之间是一对一对的关系3)出版社表: 出版社有对 ...
BZOJ 1877 拆点费用流
思路: 呃水题不解释行么,, //By SiriusRen #include <queue> #include <cstdio> #include <cstring ...
mysql数据库的介绍及安装
一.什么是数据库 1.什么是数据(Data) 描述事物的符号记录成为数据,描述事物的符号既可以是文字.图片.图像.声音.语言等,数据有多种表现形式,他们都可以经过数字化后存入计算机在计算机中描述一个 ...
.net MVC成长记录（四）Linq（1）
今天不忙,没什么事情,继续写写随笔. 之前的文章写到了EF,很多人留言EF的操作用什么? 今天,就继续给大家分享EF的操作, Linq . 先从Linq操作Object内置对象开始从Linq的基础 ...
Objective-C—— Block
OC Block 其实功能就类似C语言的函数指针,js中的闭包之类的.把代码块当做一个变量就行操作,有自己的变量和作用域. 简单看一下Block的语法和可能出现的问题: Block语法: block语 ...
CSS元素水平垂直居中的方法
1. 元素水平居中 1.1 设置父元素的属性 text-align: center; 说明:此属性只针对父元素的子元素为内联元素时有效,比如:img,input,select,button等(行内 ...
用CSS伪类制作一个不断旋转的八卦图？
前言介绍一下如何制作一个不断旋转的八卦图.快速预览代码及效果,点击:八卦图代码如下: HTML部分 <!DOCTYPE html> <html> <head> ...

逻辑斯蒂回归3 -- 最大熵模型之改进的迭代尺度法(IIS)

IIS的推导过程

IIS算法描写叙述

逻辑斯蒂回归3 -- 最大熵模型之改进的迭代尺度法(IIS)的更多相关文章

随机推荐

热门专题