logistic regression教程3

在线性拟合的基础上，我们实现logistic regression。

如前所述，样本集是

{x1,y1},{x2,y2},...,{xn,yn}[1]

其中，xi=[1,xi,1,xi,2,xi,3,...,xi,k]T，且yi∈(0,1)。注意，这里对yi有值上的要求，必须如此，如果值不再这个区间，要以归一化的方式调整到这个区间。对于分类问题，则yi的取值或者是0，或者是1，也就是yi∈{0,1}。

当然，从严格的意义上说，logistic regression拟合后，yi的值只能无限地逼近0和1，而不能真正达到0和1，但在处理实际问题上，可以设定成形如 ifyi>0.5thenyi=1和ifyi<=0.5thenyi=0解决。

Logistic regression的拟合形式如下：

yi=f(zi)[2]

zi=Wxi[3]

其中，f(z)=11+e−z[4]，也就是Logistic函数。

根据公式[2]和公式[3]，则：

yi=f(Wxi)[4]

那么，如果用公式[4]拟合xi和yi的关系，需要求解W，使得在公式[1]上误差最小。对应的损失函数就是

Loss=12∑i=1n(yi−f(Wxi))2[5]

跟前面的一样，我们用梯度下降法求解。
所以，要对公式[5]求wj的一阶偏导，于是有

∂Loss∂wj=∑i=1n(yi−f(Wxi))×(−1)×∂f(Wxi)∂wj=∑i=1n(yi−f(Wxi))×(−1)×∂f(zi)∂zi×∂zi∂wj[6]

注意，问题来了，公式[6]的最后一步，实际上是将Wxi视为一个变量zi，分别求导。这一步是在高等数学有详细描述了，不解释。

公式[6]中的∂f(zi)∂zi等价于f′(z)，因为只有一个自变量z。根据公式[4]，可以求出

f′(z)=ez(ez+1)2[7]

对公式[7]可以做一次变形，以方便求解:
根据公式[4]，可以知道

ez=f(z)1−f(z)[8]

将公式[8]代入到公式[7]，就可以得到

f′(z)=f(z)×(1−f(z))[9]

也就是说，我们可以根据f(z)得到f′(z)，而且计算量很小。

把公式[9]代入公式[6]，就得到

∂Loss∂wj=∑i=1n(yi−f(Wxi))×(−1)×∂f(zi)∂zi×∂zi∂wj=∑i=1n(yi−f(Wxi))×(−1)×f(zi)×(1−f(zi))×∂zi∂wj=∑i=1n(yi−f(Wxi))×(−1)×f(Wxi)×(1−f(Wxi))×∂(Wxi)∂wj=∑i=1n(yi−f(Wxi))×(−1)×f(Wxi)×(1−f(Wxi))×∂(Wxi)∂wj=∑i=1n(yi−f(Wxi))×(−1)×f(Wxi)×(1−f(Wxi))×xi,j=∑i=1n(yi−f(Wxi))×f(Wxi)×(f(Wxi)−1)×xi,j[10]

于是公式[10]可以写成

∂Loss∂wj=∑i=1n(yi−f(Wxi))f(Wxi)(f(Wxi)−1)xi,j[11]

那么，wj在梯度下降法的迭代公式就是

wj=wj+△wj=wj−∂Loss∂wj[12]

现在，我们开始做最麻烦的一步，将公式[11]进行矩阵化
令

Y=[y1,y2,...,yn][13]

W=[w0,w1,w2,...,wk][14]

X=⎛⎝⎜⎜⎜⎜11...1x1,1x2,1...xn,1x1,2x2,2...xn,2............x1,kx2,k...xn,k⎞⎠⎟⎟⎟⎟[15]

V=⎛⎝⎜⎜⎜⎜f(Wx1)(f(Wx1)−1)0...00f(Wx2)(f(Wx2)−1)...0............00...f(Wxn)(f(Wxn)−1)⎞⎠⎟⎟⎟⎟[16]

L=[f(Wx1),f(Wx2),...,f(Wxn)][17]

公式[16]略有一点复杂，它是对角矩阵。
根据上述设定，公式[11]的矩阵化形式就是

∂Loss∂wj=(Y−L)V⎛⎝⎜⎜⎜⎜x1,jx2,j...xn,j⎞⎠⎟⎟⎟⎟[18]

那么，对W而言，更新公式就是

W=W−(Y−L)VX[19]

到这里，logisitci regression的梯度下降法推导就结束了。下一篇我们用python实现求解过程。

logistic regression教程3的更多相关文章

logistic regression教程1
实现线性拟合我们用python2.7实现上一篇的推导结果.请先安装python matplotlib包和numpy包. 具体代码如下: #!/usr/bin/env python #! -*- co ...
ufldl学习笔记与编程作业：Logistic Regression（逻辑回归）
ufldl学习笔记与编程作业:Logistic Regression(逻辑回归) ufldl出了新教程,感觉比之前的好,从基础讲起.系统清晰,又有编程实践. 在deep learning高质量群里面听 ...
[机器学习] Coursera ML笔记 - 逻辑回归（Logistic Regression）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等.主要学习资料来自Standford Andrew N ...
逻辑回归 Logistic Regression
逻辑回归(Logistic Regression)是广义线性回归的一种.逻辑回归是用来做分类任务的常用算法.分类任务的目标是找一个函数,把观测值匹配到相关的类和标签上.比如一个人有没有病,又因为噪声的 ...
logistic regression与SVM
Logistic模型和SVM都是用于二分类,现在大概说一下两者的区别 ① 寻找最优超平面的方法不同形象点说,Logistic模型找的那个超平面,是尽量让所有点都远离它,而SVM寻找的那个超平面,是只 ...
Logistic Regression - Formula Deduction
Sigmoid Function \[ \sigma(z)=\frac{1}{1+e^{(-z)}} \] feature: axial symmetry: \[ \sigma(z)+ \sigma( ...
SparkMLlib之 logistic regression源码分析
最近在研究机器学习,使用的工具是spark,本文是针对spar最新的源码Spark1.6.0的MLlib中的logistic regression, linear regression进行源码分析,其 ...
[OpenCV] Samples 06: [ML] logistic regression
logistic regression,这个算法只能解决简单的线性二分类,在众多的机器学习分类算法中并不出众,但它能被改进为多分类,并换了另外一个名字softmax, 这可是深度学习中响当当的分类算法 ...
Stanford机器学习笔记-2.Logistic Regression
Content: 2 Logistic Regression. 2.1 Classification. 2.2 Hypothesis representation. 2.2.1 Interpretin ...

随机推荐

Angular——依赖注入
基本介绍 1.AngularJS采用模块化的方式组织代码,将一些通用逻辑封装成一个对象或函数,实现最大程度的复用,这导致了使用者和被使用者之间存在依赖关系. 2.所谓依赖注入是指在运行时自动查找依赖关 ...
Farseer.net轻量级开源框架入门篇：修改数据详解
导航目录:Farseer.net轻量级开源框架目录上一篇:Farseer.net轻量级开源框架入门篇: 添加数据详解下一篇:Farseer.net轻量级开源框架入门篇: 删除数据详解 ...
docloud后台管理项目(开篇)
最近朋友做app需要web做后台管理,所以花了一周时间做了这个项目. 废话不多说,开发环境是nginx+php5.3,使用thinkphp框架.是一个医疗器械数据统计的后台,业务功能很简单就是查看用户 ...
PHPStorm+XDebug进行调试
笔者的开发环境如下: Windows8.1+Apache+PhpStorm+XDebug+Firefox(XDebug helper 1.4.3插件). 一.XDebug安装配置 (1)下载XDebu ...
python爬虫（房天下）
房天下 import requests res = requests.get('http://esf.sz.fang.com/') #res.text from bs4 import Beautifu ...
（转）版本管理工具介绍——SVN篇(二)
http://blog.csdn.net/yerenyuan_pku/article/details/72620498 上一篇文章我介绍了一下SVN,以及SVN服务器的安装,相信大家都安装了,接下来我 ...
禁止foreach循环使用remove/add----快速失败
阿里巴巴开发手册中有一条: 7[强制]不要在 foreach 循环里进行元素的 remove / add 操作. remove 元素请使用 Iterator 方式,如果并发操作,需要对 Iterato ...
Bullet:关于ORACLE中的HASH JOIN的参数变化
Oracle在7.3引入了hash join. 但是在Oracle 10g及其以后的Oracle数据库版本中,优化器,实际是CBO,也是因为HASH JOIN仅适用于CBO,在解析目标SQL时是否考虑 ...
Java中对象流使用的一个注意事项
再写jsp的实验作业的时候,需要用到java中对象流,但是碰到了之前没有遇到过的情况,改bug改到崩溃!!记录下来供大家分享如果要用对象流去读取一个文件,一定要先判断这个文件的内容是否为空,如果为空 ...
对于前端请求Django 后端服务出现403 Forbidden (CSRF token missing or incorrect.) 问题的解析
Django中使用ajax post向後臺傳送資料時403 Forbidden (CSRF token missing or incorrect.):的解決辦法在Django中使用ajax post ...

logistic regression教程3

logistic regression教程3的更多相关文章

随机推荐

热门专题