【笔记】机器学习 - 李宏毅 - 6

Logistic Regression 逻辑回归

逻辑回归与线性回归有很多相似的地方。后面会做对比，先将逻辑回归函数可视化一下。

与其所对应的损失函数如下，并将求max转换为min，并转换为求指数形式，便于计算。

最后得到的是两个伯努利分布（function output & target）的交叉熵（两个分布的接近程度，如果分布相同，则交叉熵为0）。

经过求导，最后得到的损失函数的偏导数和线性回归的是形式一致的。将其三个步骤的对比归纳如下。

为何用交叉熵而不用平方差，因为逻辑回归模型在求导过程中，没有命中target导数也为0，得到的结果不正确。而且即使不为0，因为微分值小，也会导致迭代速度很慢。

逻辑回归的方法称为Discriminative（判别）方法；上一篇中用高斯来描述后验概率，称为 Generative（生成）方法。他们的函数集都是一样的，只是描述方式不同。

如果是逻辑回归，就可以直接用梯度下降法找出w和b；如果是概率生成模型，像上篇那样求出 \(μ^1, μ^2\)，协方差矩阵的逆，然后就能算出w和b。

因为中间经过的步骤不同，所以最后得到的结果准确率也有所区别。

下面这个例子说明，用贝叶斯方法在计算概率的时候，机器“脑补”了数据量不足所掩盖的可能性。

判别比生成好吗？生成方法相比于判别方法，需要的训练数据量更小，鲁棒性更好，先验和类相关的概率可以从不同的来源计算。
比如语音识别中计算先验概率，用的生成方法，并不全是DNN。

多分类问题

Softmax是进行exponential（指数化），将exponential 的结果相加，再分别用 exponential 的结果除以相加的结果。
原本\(z_1,z_2,z_3\)可以是任何值，但做完Softmax之后输出会被限制住，都介于0到1之间，并且和是1。Softmax就是对最大值进行强化。
指数簇分布的最大熵等价于其指数形式的最大似然界，应用如二项式的sigmoid, 多项式的softmax。

\(\hat{y}\)也定义成矩阵形式，计算交叉熵。

如果说两个类别分布在两个对角线的两端，则需要先进行特征转换，多加一层操作，深度学习的神经网络就是类似这样的多层操作。

【笔记】机器学习 - 李宏毅 - 6 - Logistic Regression的更多相关文章

[机器学习] Coursera ML笔记 - 逻辑回归（Logistic Regression）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等.主要学习资料来自Standford Andrew N ...
机器学习技法笔记：05 Kernel Logistic Regression
Roadmap Soft-Margin SVM as Regularized Model SVM versus Logistic Regression SVM for Soft Binary Clas ...
Andrew Ng机器学习编程作业:Logistic Regression
编程作业文件: machine-learning-ex2 1. Logistic Regression (逻辑回归) 有之前学生的数据,建立逻辑回归模型预测,根据两次考试结果预测一个学生是否有资格被大 ...
机器学习实战python3 Logistic Regression
代码及数据:https://github.com/zle1992/MachineLearningInAction logistic regression 优点:计算代价不高,易于理解实现,线性模型的一 ...
Andrew Ng机器学习二： Logistic Regression
一:逻辑回归(Logistic Regression) 背景:假设你是一所大学招生办的领导,你依据学生的成绩,给与他入学的资格.现在有这样一组以前的数据集ex2data1.txt,第一列表示第一次测验 ...
Python_sklearn机器学习库学习笔记（三）logistic regression（逻辑回归）
# 逻辑回归 ## 逻辑回归处理二元分类 %matplotlib inline import matplotlib.pyplot as plt #显示中文 from matplotlib.font_m ...
机器学习简要笔记（五）——Logistic Regression(逻辑回归）
1.Logistic回归的本质逻辑回归是假设数据服从伯努利分布,通过极大似然函数的方法,运用梯度上升/下降法来求解参数,从而实现数据的二分类. 1.1.逻辑回归的基本假设 ①伯努利分布:以抛硬币为例 ...
吴恩达机器学习笔记14-逻辑回归(Logistic Regression)
在分类问题中,你要预测的变量
逻辑回归 logistic regression（1）逻辑回归的求解和概率解释
本系列内容大部分来自Standford公开课machine learning中Andrew老师的讲解,附加自己的一些理解,编程实现和学习笔记. 第一章 Logistic regression 1.逻辑 ...

随机推荐

ubuntu 14.04 安装wordpress
转者注:若没有Apache + PHP + MySQL环境,请参考我的这篇博客 (1)首先下载wordpress, sudo wget http://wordpress.org/latest.tar. ...
css-position:absolute, relative 的用法
static(静态) 没有特别的设定,遵循基本的定位规定,不能通过z-index进行层次分级.就无法通过top,left ,bottom,right 定位.(static 为默认值) relat ...
[python]bytes和str
Python 3.6.1 (v3.6.1:69c0db5050, Mar 21 2017, 01:21:04) [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] ...
POJ_1376_bfs
题目描述: 给定一个黑白格子的图,黑格子是障碍物,一个线段交点的起点,一个线段交点的终点和初始方向,机器人从起点开始,只能沿着线段,走到终点,期间不能沿着障碍物边缘和墙边缘. 一次操作可以向当前方向走 ...
vs2017项目上传到github
如果要把项目提交到一个厂库里面,需要建个git存储库,比如选择新建git库选择VSVIEW文件夹,以后在这个文件夹下的项目,提交时都会提交到VSVIEW这个github仓库选择的文件夹不在git文件 ...
NFA和DFA的区别
NFA DFA 初始状态不唯一唯一弧上的标记字(单字符字/ε) 字符(串) 转换关系非确定确定对于每个NFA M都存在一个DFA M' 使得 L(M) = L(M')
数据结构与算法的实现（c++）之第一天
开发工具:codeblocks 17.12版本学习视频来自b站第一天:学习swap交换.冒泡排序 swap交换:swap是几乎所有的排序的最基础部分,代码如下: #include <iost ...
一起了解 .Net Foundation 项目 No.1
.Net 基金会中包含有很多优秀的项目,今天就和笔者一起了解一下其中的一些优秀作品吧. 中文介绍中文介绍内容翻译自英文介绍,主要采用意译.如与原文存在出入,请以原文为准. Akka.NET Akka ...
java中list的sort()功能如何使用？如果倒序如何正序？
list.sort()接收一个Comparable接口,其中compare方法是必须实现的,int compare(T o1, T o2);,它接受两个参数:o1,o2. o2表示list排序前的前值 ...
基于MR实现ngram语言模型
在大数据的今天,世界上任何一台单机都无法处理大数据,无论cpu的计算能力或者内存的容量.必须采用分布式来实现多台单机的资源整合,来进行任务的处理,包括离线的批处理和在线的实时处理. 鉴于上次开会讲了语 ...

【笔记】机器学习 - 李宏毅 - 6 - Logistic Regression

【笔记】机器学习 - 李宏毅 - 6 - Logistic Regression的更多相关文章

随机推荐

热门专题