2.2 logistic回归损失函数（非常重要，深入理解）

上一节当中，为了能够训练logistic回归模型的参数w和b，需要定义一个成本函数
1. 使用logistic回归训练的成本函数
  2. 为了让模型通过学习来调整参数，要给出一个含有m和训练样本的训练集
  3. 很自然的，希望通过训练集找到参数w和b，来得到自己得输出
  4. 对训练集当中的值进行预测，将他写成y^（I）我们希望他会接近于训练集当中的y^（i）的数值
现在来看一下损失函数或者叫做误差函数
1. 他们可以用来衡量算法的运行情况
2. 可以定义损失函数为y^和y的差，或者他们差的平方的一半，结果表明你可能这样做，但是实际当中，大家都不会这么做，因为当你学习这些参数的时候，你会发现之后讨论的优化问题，会变成非凸的，最后会得到很多的局部最优解，梯度下降算法可能找不到最优的全局最优值，
3. 直观理解就是我们定义这个损失函数L，来衡量你的预测输出值y^和y的实际值有多接近，误差平方看起来是一个合理的选择，但是如果用这个的话，梯度下降法就不会很好用，
4. 在logistic回归中，我们会定义一个不同的损失函数，它起着于误差平方相似的作用，这会给我们一个凸的优化问题，他很容易去做优化，
5. 在logistic回归中，我们用的损失函数将会是下面这样的，（非常重要！）
  2. 直观的看一下为什么这个函数会起到作用，
    1. 记得如果我们使用误差平方越小越好
    2. 对于这个logistic回归的损失函数，同样的，我们也想让它尽可能的小，
  3. 为了更好的理解它能起到好的作用，来看两个例子
    1. 当y=1的时候，就是第一项L带个负号，
      1. 这就是说，当y=1的时候，你想让-log(y^)尽可能小（代表着误差尽可能的小），那么就需要y^足够大，但是因为y^是sigmoid函数得出来的，永远不会比1大，也就是说，如果y=1的时候，你想让y^，尽可能的大，但是它永远不会大于1，所以你要让y^接近1（从sigmoid函数的图像上看一下，采取什么样的措施才能够让y^接近于1呢？就是上一节分析的那样），
    2. 当y=0的时候，
      1. 在学习过程中，想让损失函数小一些，也就意味着你想要log(1-y^)够大，通过这一系列的推导，发现，损失函数让y^尽可能的小，再次，因为y^只能介于0和1之间，所以就是说，当y=0的时候，损失函数会让这些让y^尽可能的接近0，有很多函数都能够达到上面的效果，
  4. 如果y=1，我们尽可能的让y^很大，如果y=0，尽可能的让y^足够小，
    1. 给出解释为什么在logistic回归中，要使用这个形式的损失函数。
  5. 最后说一下
    1. 在单个训练样本中定义的，它衡量了在单个训练样本上的表现（个人理解也就是一个训练集中的每个训练样本），
下面定义一个成本函数
1. 它衡量的是在全体训练样本上的表现，这个成本函数J，根据之前得到的两个参数w和b，J(w,b)等于所有的训练样本的损失函数的和的平均数
2. y^是用一组特定的参数w和b，通过logistic回归算法得出的预测输出值，
3. 损失精度函数适用于单个训练样本，而成本函数，基于参数的总成本，所以在训练logistic回归模型的是时候，我们需要找到合适的参数w和b，让下面这里的成本函数尽可能的小，
这一节我们看到了logistic回归算法的过程，以及训练样本的损失函数，还有和参数相关的总体成本函数，结果表明，logistic回归可以被看作是一个非常小的神经网络，
下一节讲解，神经网络能够做什么，看看如何将logistic回归看做一个非常小得神经网络，

来自为知笔记(Wiz)

2.2 logistic回归损失函数（非常重要，深入理解）的更多相关文章

logistic回归损失函数（非常重要，深入理解）
2.2 logistic回归损失函数(非常重要,深入理解) 上一节当中,为了能够训练logistic回归模型的参数w和b,需要定义一个成本函数使用logistic回归训练的成本函数为了让模型通过学 ...
感知机、logistic回归损失函数对比探讨
感知机.logistic回归损失函数对比探讨感知机假如数据集是线性可分的,感知机学习的目标是求得一个能够将正负样本完全分开的分隔超平面 \(wx+b=0\) .其学习策略为,定义(经验)损失函数 ...
2.9 logistic回归中的梯度下降法（非常重要，一定要重点理解）
怎么样计算偏导数来实现logistic回归的梯度下降法它的核心关键点是其中的几个重要公式用来实现logistic回归的梯度下降法接下来开始学习logistic回归的梯度下降法 logistic回归 ...
logistic回归具体解释(二）：损失函数（cost function）具体解释
有监督学习机器学习分为有监督学习,无监督学习,半监督学习.强化学习.对于逻辑回归来说,就是一种典型的有监督学习. 既然是有监督学习,训练集自然能够用例如以下方式表述: {(x1,y1),(x2,y2 ...
『科学计算』通过代码理解线性回归&Logistic回归模型
sklearn线性回归模型 import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model de ...
Logistic回归总结
原文:http://blog.csdn.net/dongtingzhizi/article/details/15962797 Logistic回归总结作者:洞庭之子微博:洞庭之子-Bing (2 ...
【转载】logistic回归
原文地址:https://www.cnblogs.com/zichun-zeng/p/3824745.html 1. logistic回归与一般线性回归模型的区别: (1) 线性回归的结果变量 ...
如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
对线性回归，logistic回归和一般回归的认识
原文:http://www.cnblogs.com/jerrylead/archive/2011/03/05/1971867.html#3281650 对线性回归,logistic回归和一般回归的认识 ...

随机推荐

es6转码和package.json中的配置
在线实时转换需要babel-register .babelrc中: { "presets": [ "es2015" ] } 项目中main.js配置: 前提是 ...
win下的终端使用指南
win下的终端使用指南 win 下的命令行工具是真的难用 . 具体的难用就不形容了 . 有了 PowerShell 也没觉得好用 . 还是喜欢Linux的终端,及Bash命令. 替换方案比较好的替换 ...
kali2019.4试用记录
问题一:中文乱码 https://blog.csdn.net/dust_hk/article/details/103299136 参考以上博文即可解决: 1.设置locales. dpkg-recon ...
c#实现把异常写入日志示例(异常日志)
将异常写到日志文件中,可以在调试程序的时候知道程序发生过哪些异常,并且可以知道异常发生的位置.这点对需要进行长时间运行并调试的程序尤为有效. /// <summary> /// 将异常打印 ...
python递归删除目录本身以及目录下文件
import os def local_rm(dirpath): if os.path.exists(dirpath): files = os.listdir(dirpath) for file in ...
洛谷P1402 酒店之王（网络流）
### 洛谷P1402 题目链接 ### 题目大意:有 n 个人, p 间房间,q 种食物.每个人喜欢一些房间,一些食物,但每间房间.每种食物只能分配给一个人.问最大可以让多少个人满足(当且仅当分配到 ...
javascript初学笔记
基本语句赋值条件循环语句 javascript异常处理语句 trycatchfinally语句 Error对象 throw语句函数定义调用嵌套函数函数的嵌套定义内置函数匿名函数和Fun ...
大话STM32F103系统架构
前言许多像我一样的STM32初学者,都往往忽视了STM32系统架构的学习.这对于实际应用并没有啥大的影响,但是总感觉怎么学也无法看清STM32的全貌,所以本文我将带领大家一起厘清STM32F103的 ...
linux 配置compoer
配置默认php 删除 rm -f /usr/bin/php 改到php7.3版本的composer /bin/php /usr/bin/php 多版本支持配置php7专用composer70 cd ...
大型数据库技术实验六实验6：Mapreduce实例——WordCount
现有某电商网站用户对商品的收藏数据,记录了用户收藏的商品id以及收藏日期,名为buyer_favorite1. buyer_favorite1包含:买家id,商品id,收藏日期这三个字段,数据以“\t ...

2.2 logistic回归损失函数（非常重要，深入理解）

2.2 logistic回归损失函数（非常重要，深入理解）的更多相关文章

随机推荐

热门专题