ML-分类与逻辑回归

布尔分类（binary classification）问题：

训练集：$S=\{(x^{(i)}, y^{(i)})\}$

输入：特征向量$x$

期望输出：$y\in\{0, 1\}$

这里使用的假设函数（hypotheses）不再是特征向量各分量的线性组合，而是：

$h_{\theta}(x) = g(\theta^Tx) = \frac{1}{1 + \text{exp}(-\theta^Tx)}$

这里$g(x)$即逻辑（logistic）函数或称S型（sigmoid）函数。

Note：尽管从$0-1$平滑增长的函数还有很多，但由于一些原因（我们以后将会看到），S型函数是一个相当合理的选择。

先考虑函数$g(x)$的导数：

$\frac{dg(x)}{dx} = \frac{1}{dx}d\frac{1}{1 + \text{exp}(-x)}$

$= \frac{e^{-x}}{(1 + e ^ {-x}) ^ 2}$

$=g(x)(1 - g(x))$

我们做出如下假定（assumptions）：

$P(y = 1 | x; \theta) = h_\theta(x)$

$P(y = 0 | x; \theta) = 1 - h_\theta(x)$

合并两式，可以得到：

$p(y | x; \theta) = (h_\theta(x))^y(1 - h_\theta(x))^{1 - y}$

我们进一步假设$S$中训练样本都是相互独立的，那么关于参数$\theta$的似然函数可以写成：

$L(\theta) = p(\vec{y} | X; \theta)$

$=\prod_{i = 1}^{m}p(y^{(i)} | x^{(i)}; \theta)$

$=\prod_{i = 1}^{m}(h_\theta(x^{(i)}))^{y^{(i)}}(1 - h_\theta(x^{(i)}))^{1 - y^{(i)}}$

为了最大化$L(\theta)$，我们间接地最大化如下式子：

$l(\theta) = \text{log}L(\theta)$

$=\sum_{i = 1}^{m}y^{(i)}\text{log }h(x^{(i)}) + (1 - y^{(i)})\text{log}(1 - h(x^{(i)}))$

依旧考虑使用梯度下降更新$\theta$：

$\theta := \theta + \alpha\nabla_\theta l(\theta)$

Note：由于是最大化，因此这里梯度前的运算符使用$+$号

$\nabla_\theta l(\theta) = \sum_{i = 1}^m{y^{(i)}\cdot \frac{1}{h(x^{(i)})}\cdot \nabla_\theta h(x^{(i)})+(1 - y^{(i)})\cdot \frac{1}{1-h(x^{(i)})}\cdot \nabla_\theta(1 - h(x^{(i)}))}$

$=\sum_{i = 1}^m{\nabla_\theta h(x^{(i)})\cdot \frac{y^{(i)} - h(x^{(i)})}{h(x^{(i)})(1 - h(x^{(i)}))}}$

$=\sum_{i = 1}^m{\nabla_\theta g(\theta^Tx^{(i)})\cdot \frac{y^{(i)} - g(\theta^Tx^{(i)})}{g(\theta^Tx^{(i)})(1 - g(\theta^Tx^{(i)}))}}$

$=\sum_{i = 1}^m(y^{(i)} - g(\theta^Tx^{(i)}))x^{(i)}$

于是这样更新$\theta$：

$\theta := \theta + \alpha\sum_{i = 1}^m(y^{(i)} - g(\theta^Tx^{(i)}))x^{(i)}$

你或许会惊奇地发现，这里的更新规则与线性回归完全相同。

下面给出另一种最大化$l(\theta)$的方法。

牛顿迭代法求方程的实根：

对于函数$f:\mathbb{R}\rightarrow \mathbb{R}$，且存在某个实数$\theta$满足$f(\theta) = 0$，牛顿迭代法进行如下操作：

$\theta := \theta - \frac{f(\theta)}{f'(\theta)}$

来逼近$f$的根。

为了最大化$l(\theta)$，使用牛顿迭代逼近$l'(\theta)$的根。

即进行操：

$\theta := \theta - \frac{l'(\theta)}{l''(\theta)}$

在高维情形下，我们需要使用牛顿-拉弗森方法（Newton-Raphson method），更新方法如下：

$\theta := H^{-1}\nabla_\theta l(\theta)$

其中$H$是海森（Hessian）矩阵，定义方法如下：

$H_{ij}=\frac{\partial^2 l(\theta)}{\partial \theta_i \theta_j}$

通常情况下使用N-R方法更快（相较于梯度下降法）。

ML-分类与逻辑回归的更多相关文章

CS229笔记：分类与逻辑回归
逻辑回归对于一个二分类(binary classification)问题,$y \in \left\{0, 1\right\}$,如果直接用线性回归去预测,结果显然是非常不准确的,所以我们采用一 ...
分类和逻辑回归(Classification and logistic regression)
分类问题和线性回归问题问题很像,只是在分类问题中,我们预测的y值包含在一个小的离散数据集里.首先,认识一下二元分类(binary classification),在二元分类中,y的取值只能是0和1.例 ...
斯坦福CS229机器学习课程笔记 part2：分类和逻辑回归 Classificatiion and logistic regression
Logistic Regression 逻辑回归 1.模型逻辑回归解决的是分类问题,并且是二元分类问题(binary classification),y只有0,1两个取值.对于分类问题使用线性回归不 ...
[Machine Learning] 逻辑回归 (Logistic Regression) -分类问题-逻辑回归-正则化
在之前的问题讨论中,研究的都是连续值,即y的输出是一个连续的值.但是在分类问题中,要预测的值是离散的值,就是预测的结果是否属于某一个类.例如:判断一封电子邮件是否是垃圾邮件:判断一次金融交易是否是欺诈 ...
机器学习算法笔记1_2:分类和逻辑回归(Classification and Logistic regression)
形式: 採用sigmoid函数: g(z)=11+e−z 其导数为g′(z)=(1−g(z))g(z) 如果: 即: 若有m个样本,则似然函数形式是: 对数形式: 採用梯度上升法求其最大值求导: 更 ...
Machine Learning--week3 逻辑回归函数(分类)、决策边界、逻辑回归代价函数、多分类与(逻辑回归和线性回归的)正则化
Classification It's not a good idea to use linear regression for classification problem. We can use ...
ML（4）——逻辑回归
Logistic Regression虽然名字里带“回归”,但是它实际上是一种分类方法,“逻辑”是Logistic的音译,和真正的逻辑没有任何关系. 模型线性模型由于逻辑回归是一种分类方法,所以我 ...
逻辑回归（logic regression）的分类梯度下降
首先明白一个概念,什么是逻辑回归:所谓回归就是拟合,说明x是连续的:逻辑呢?就是True和False,也就是二分类:逻辑回归即使就是指对于二分类数据的拟合(划分). 那么什么是模型呢?模型其实就是函数 ...
【机器学习】Octave 实现逻辑回归 Logistic Regression
ex2data1.txt ex2data2.txt 本次算法的背景是,假如你是一个大学的管理者,你需要根据学生之前的成绩(两门科目)来预测该学生是否能进入该大学. 根据题意,我们不难分辨出这是一种二分 ...
线性回归，感知机，逻辑回归（GD，SGD）
线性回归线性回归是一个回归问题,即用一条线去拟合训练数据线性回归的模型: 通过训练数据学习一个特征的线性组合,以此作为预测函数. 训练目标:根据训练数据学习参数(w1,w2, ... , wn,b ...

随机推荐

EntityFramework 连接字符串
1. Microsoft SQL Server 2016 LocalDB <connectionStrings> <add name="DefaultConnection& ...
给Source Insight做个外挂系列之五－－Insight “TabSiPlus”
“TabSiPlus 外挂插件”主要有两部分组成,分别是“外挂插件加载器”和“插件动态库”.“插件动态库”完成Source Insight窗口的Hook,显示Tab标签栏,截获Source Insig ...
sublime通用快捷键汉化安装插件
Ctrl+Alt+P 切换项目 1.Ctrl+Shift+P 打开Package Control Ctrl + Shift + P ,输入View, 选择Toogle Tabs ...
Python开发【十二章】：ORM sqlalchemy
一.对象映射关系(ORM) orm英文全称object relational mapping,就是对象映射关系程序,简单来说我们类似python这种面向对象的程序来说一切皆对象,但是我们使用的数据库却 ...
Tyrion中文文档（含示例源码）
Tyrion是一个基于Python实现的支持多个WEB框架的Form表单验证组件,其完美的支持Tornado.Django.Flask.Bottle Web框架.Tyrion主要有两大重要动能: 表单 ...
JavaScript增强AJAX基础
<title>js类型</title> <meta http-equiv="content-type" content="text/html ...
JS调用中文乱码怎么办
网络上有很多的实用的小插件,这些小插件可以直接拿过来实用即可,但是在使用的时候会出现很多的问题,就比如与说今天要讲的乱码中文乱码的问题,这个主要是因为我们调用的js和我们写的程序使用的编码不同,那么如 ...
Ubuntu Dev Box Setup
Editor VIM Sublime Atom Visual Studio Code SSH Client PAC Manager File Manager Double Commander Imag ...
（转）如何将本地git仓库上传到GitHub中托管+实践心得
Git——新手入门与上传项目到远程仓库GitHub(转) - Chen_s - 博客园http://www.cnblogs.com/Chenshuai7/p/5486278.html 注意的问题: 1 ...
配置java环境，安装Android Studio...(ps:用eclipse也不错，但as是趋势自己凭爱好选择)
to:青科大可爱的学弟学妹: 配置java环境 step1:下jdk 直接打开链接即可(ps:复制链接到迅雷下载更快哦) 64位的:http://download.oracle.com/otn-pub ...

ML-分类与逻辑回归

ML-分类与逻辑回归的更多相关文章

随机推荐

热门专题