[斯坦福大学2014机器学习教程笔记]第六章-决策界限(decision boundary)

这一节主要介绍的是决策界限(decision boundary)的概念，这个概念可以帮组我们更好地理解逻辑回归的假设函数在计算什么。

首先回忆一下上次写的公式。

现在让我们进一步了解这个假设函数在什么时候会将y预测为1，什么时候会将y预测为0。并且更好地理解假设函数的形状，特别是当我们的数据有多个特征值时。具体地说，这个假设函数输出的是给定x和参数θ时，y=1的估计概率。

所以，如果我们想预测y=1还是等于0。该假设函数输出y=1的概率大于等于0.5，此时预测的为y=1，小于0.5预测的就是y=0。（实际上，当输出概率为0.5时，可以预测为y=1，也可以预测为y=0）

仔细观察sigmoid函数图像，就可以发现只要z≥ 0，g(z)就大于等于0.5，因此在曲线图的右半边，g的取值都是大于等于0.5的。

由于逻辑回归的假设函数h_θ(x)=g(θ^Tx)，所以只要θ^Tx≥ 0，那么h_θ(x)就会大于等于0.5，此时假设函数将会预测为y=1。同样，我们考虑假设函数预测为y=0的情况。当h_θ(x)＜ 0.5的时候，就会预测y=0。而只要θ^Tx＜ 0，那么g(θ^Tx)就会小于0.5，即h_θ(x)就会小于0.5。

对上述做个小结：

1.我们预测y=0还是y=1取决于输出的概率值。（概率大于等于0.5预测y=1，小于0.5预测y=0）

2.想要预测结果为 y=1，就要保证θ^Tx≥ 于0；想要预测结果为 y=0，就要保证θ^Tx＜ 0。

接下来，假设我们有一个训练集。我们的假设函数是h_θ(x)=g(θ₀+θ₁x₁+θ₂x₂)，我们将在下一节讨论如何拟合此模型中的参数，此时假设我们已经拟合好了参数。在这里，我们选这里θ₀=-3，θ₁=1，θ₂=1。这意味着此时的参数向量θ=[-3,1,1]^T。接下来，尝试找出该假设函数何时将预测y=1，何时将预测y=0。

根据之前小结的，y=1的概率大于等于0.5时，就预测y=1，小于0.5时就预测y=0。换句话说就是：想要预测结果为y=1，就要保证θ^Tx≥ 0；想要预测结果为y=0，就要保证θ^Tx＜ 0。而在这个例子中θ^Tx就是-3+x₁+x₂。所以，在这个例子中，只要 -3+x₁+x₂≥ 0，那么预测的就会是y=1，-3+x₁+x₂＜ 0，那么预测的就会是y=0。当然也可以将 -3+x₁+x₂≥ 0 改写为 x₁+x₂≥ 3。

接下来我们可以在图像上观察这个式子。

图上洋红色的直线为x₁+x₂= 3 。该线上方的区域为预测y=1的区域，下方区域为预测y=0的区域。这条线被称为决策边界。具体地说，x₁+x₂= 3这条直线对应的一系列的点对应的是h_θ(x)=0.5的点。决策边界将整个平面分成了两个部分。一部分区域预测y=1，另一部分预测y=0。

决策边界是假设函数的一个属性，它包括参数θ₀、θ₁和θ₂。在上图中，是画了训练的数据集的。需要明确的是：即使没有画出数据集，只要参数给定，这条决策边界以及两部分区域都是确定的。它们都是假设函数的属性，取决于参数，而不是取决于数据集。

接下来，我们看一个更复杂的例子。在图中x表示的是正样本，圆圈表示的是负样本。

现在的问题是：当给定一个这样的数据集之后，我们要如何使用逻辑回归来拟合这些数据。

之前，当我们讲解多项式回归或线性回归时，我们谈到了可以在特征中添加额外的高阶多项式项。同样的，我们也可以对逻辑回归使用同样的方法。具体地说，假设现在的假设函数是h_θ(x)=g(θ₀+θ₁x₁+θ₂x₂+θ₃x₁²+θ₄x₂²）。现在添加了两个额外的特征x₁²和₂²，所以现在有五个参数，从θ₀一直到θ₄。现在假设θ₀=-1，θ₁=0，θ₂=0，θ₃=1，θ₄=1。这意味着此时的参数向量θ=[-1,0,0,1,1]^T。根据之前的讨论，这意味着当-1+x₁²+₂²≥ 0时，将预测y=1，当-1+x₁²+₂²< 0时，将预测y=0。同样的，-1+x₁²+₂²≥ 0 可以写成 x₁²+₂²≥ 1。此时的决策边界就为x₁²+₂²= 1。

决策边界如图所示。此时圈外的区域为预测y=1的区域，圈内的区域为预测y=0的区域。

通过在特征中增加这些复杂的多项式，可以得到更复杂的决策边界。

再次强调：

决策边界不是训练集的属性，是假设本身和其参数的属性。只要给定了参数向量θ，决策边界就可以确定。我们不是用训练集来确定决策边界，而是用训练集来拟合参数。

当我们有更高阶多项式，我们得到的决策边界也是更复杂的。逻辑回归可以用于寻找决策边界。

[斯坦福大学2014机器学习教程笔记]第六章-决策界限(decision boundary)的更多相关文章

[斯坦福大学2014机器学习教程笔记]第六章-代价函数(Cost function)
在这节中主要讲的是如何更好地拟合逻辑回归模型的参数θ.具体来说,要定义用来拟合参数的优化目标或者叫代价函数,这便是监督学习问题中的逻辑回归模型的拟合问题. 我们有一个训练集,训练集中有m个训练样本:{ ...
[斯坦福大学2014机器学习教程笔记]第五章-控制语句：for,while,if语句
在本节中,我们将学习如何为Octave程序写控制语句. 首先,我们先学习如何使用for循环.我们将v设为一个10行1列的零向量. 接着,我们写一个for循环,让i等于1到10.写出来就是for i = ...
IOS学习之斯坦福大学IOS开发课程笔记(第六课)
转载请注明出处 http://blog.csdn.net/pony_maggie/article/details/28398697 作者:小马这节课主要讲述多个MVC是怎样协同工作的.到眼下为止.全 ...
Deep Learning 8_深度学习UFLDL教程：Stacked Autocoders and Implement deep networks for digit classification_Exercise（斯坦福大学深度学习教程）
前言 1.理论知识:UFLDL教程.Deep learning:十六(deep networks) 2.实验环境:win7, matlab2015b,16G内存,2T硬盘 3.实验内容:Exercis ...
Deep Learning 19_深度学习UFLDL教程：Convolutional Neural Network_Exercise（斯坦福大学深度学习教程）
理论知识:Optimization: Stochastic Gradient Descent和Convolutional Neural Network CNN卷积神经网络推导和实现.Deep lear ...
Deep Learning 12_深度学习UFLDL教程：Sparse Coding_exercise（斯坦福大学深度学习教程）
前言理论知识:UFLDL教程.Deep learning:二十六(Sparse coding简单理解).Deep learning:二十七(Sparse coding中关于矩阵的范数求导).Deep ...
Deep Learning 13_深度学习UFLDL教程：Independent Component Analysis_Exercise（斯坦福大学深度学习教程）
前言理论知识:UFLDL教程.Deep learning:三十三(ICA模型).Deep learning:三十九(ICA模型练习) 实验环境:win7, matlab2015b,16G内存,2T机 ...
Deep Learning 11_深度学习UFLDL教程：数据预处理（斯坦福大学深度学习教程）
理论知识:UFLDL数据预处理和http://www.cnblogs.com/tornadomeet/archive/2013/04/20/3033149.html 数据预处理是深度学习中非常重要的一 ...
Deep Learning 10_深度学习UFLDL教程：Convolution and Pooling_exercise（斯坦福大学深度学习教程）
前言理论知识:UFLDL教程和http://www.cnblogs.com/tornadomeet/archive/2013/04/09/3009830.html 实验环境:win7, matlab ...

随机推荐

LaTeX常用符号(持续更新)
参考网址:https://qianwenma.cn/2018/05/17/mathjax-yu-fa-can-kao/# 基本运算 1.乘法$x\times y$ x\times y 2.乘法$x^{ ...
cb25a_c++_函数对象简介
cb25a_c++_函数对象简介预定义的函数对象https://blog.csdn.net/txwtech/article/details/104382505negate<type>()p ...
cb19a_c++_只适合string类型的操作_提取_追加_替换
*cb19a_c++_只适合string类型的操作_提取_追加_替换三个substr重载函数-获取一个字符串的一部分六个append重载函数-追加字符十个replace重载函数-替换更换重载函数越多 ...
Matlab 常用语法速记 1
===快捷帮助=== 查找帮助:doc 函数名强制终止: ctrl + c 注释: % 清屏 clc,清临时变量窗口 clear NaN: not a number inf: infinite == ...
disruptor架构一
Disruptor是一个高性能的异步处理框架,或者可以认为是最快的消息框架(轻量的JMS),也可以认为是一个观察者模式的实现,或者事件监听模式的实现. 在使用之前,首先说明disruptor主要功能加 ...
关于MySQL事务和存储引擎常见FAQ
1.什么是事务? 事务就是「一组原子性的SQL查询」,或者说一个独立的工作单元.如果数据库引擎能够成功地对数据库应用该组查询的全部语句,那么就执行该组查询.如果其中有任何一条语句因为崩溃或其他原因无法 ...
C++的逗号运算符
逗号运算符( , )是C++语言运算符中优先级最低的一种运算符,结合顺序是从左至右,用来顺序求值(最后一个逗号后面表达式的值作为整个表达式的值). 感觉这个东西还是挺冷门的,之前都不知道,平时也比较少 ...
Docker编写镜像发布个人网站
推荐国内镜像中心:网易云镜像----> https://c.163.com/hub#/home 或者歪果镜像---> https://hub.docker.com/ 博客地址:http: ...
黑鸟码表BB10S骑行记录导入行者
前言开始骑车用行者app记录, 后来觉得每次都要开app很麻烦, 于是在骑友的推荐下入手了黑鸟BB10S, 使用了一段时间感觉还不错, 不过也遇到之前大家说的问题, 黑鸟不支持直接导出fit文件, ...
sql 语句和实例
修改字段格式的sql语句: alter table tablename alter column colname newDataType 比如:alter table mytable alter co ...

[斯坦福大学2014机器学习教程笔记]第六章-决策界限(decision boundary)

[斯坦福大学2014机器学习教程笔记]第六章-决策界限(decision boundary)的更多相关文章

随机推荐

热门专题