[ch03-01] 均方差损失函数

【[ch03-01] 均方差损失函数】的更多相关文章

[ch03-01] 均方差损失函数

系列博客,原文在笔者所维护的github上:https://aka.ms/beginnerAI, 点击star加星不要吝啬,星越多笔者越努力. 3.1 均方差函数 MSE - Mean Square Error. 该函数就是最直观的一个损失函数了,计算预测值和真实值之间的欧式距离.预测值和真实值越接近,两者的均方差就越小. 均方差函数常用于线性回归(linear regression),即函数拟合(function fitting).公式如下: \[ loss = {1 \over 2}(z-y…

TensorFlow2.0（8）：误差计算——损失函数总结

.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px solid #000; } .table { border-collapse: collapse !important; } .table td, .table th { background-color: #fff !important; } .table-bordered th, .table-bordere…

[ch03-00] 损失函数

系列博客,原文在笔者所维护的github上:https://aka.ms/beginnerAI, 点击star加星不要吝啬,星越多笔者越努力. 第3章损失函数 3.0 损失函数概论 3.0.1 概念在各种材料中经常看到的中英文词汇有:误差,偏差,Error,Cost,Loss,损失,代价......意思都差不多,在本书中,使用"损失函数"和"Loss Function"这两个词汇,具体的损失函数符号用J来表示,误差值用loss表示. "损失"…

逻辑回归损失函数(cost function)

逻辑回归模型预估的是样本属于某个分类的概率,其损失函数(Cost Function)可以像线型回归那样,以均方差来表示:也可以用对数.概率等方法.损失函数本质上是衡量”模型预估值“到“实际值”的距离,选取好的“距离”单位,可以让模型更加准确. 1. 均方差距离 \[{J_{sqrt}}\left( w \right) = {\sum\limits_{i = 1}^m {{y_i}\left( {1 - p\left( {{x_i};w} \right)} \right)} ^2} + \left…

深度神经网络（DNN）损失函数和激活函数的选择

在深度神经网络(DNN)反向传播算法(BP)中,我们对DNN的前向反向传播算法的使用做了总结.里面使用的损失函数是均方差,而激活函数是Sigmoid.实际上DNN可以使用的损失函数和激活函数不少.这些损失函数和激活函数如何选择呢?下面我们就对DNN损失函数和激活函数的选择做一个总结. 1. 均方差损失函数+Sigmoid激活函数的问题在讲反向传播算法时,我们用均方差损失函数和Sigmoid激活函数做了实例,首先我们就来看看均方差+Sigmoid的组合有什么问题. 首先我们回顾下Sigmoid激…

[ch03-02] 交叉熵损失函数

系列博客,原文在笔者所维护的github上:https://aka.ms/beginnerAI, 点击star加星不要吝啬,星越多笔者越努力. 3.2 交叉熵损失函数交叉熵(Cross Entropy)是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息.在信息论中,交叉熵是表示两个概率分布 \(p,q\) 的差异,其中 \(p\) 表示真实分布,\(q\) 表示非真实分布,那么\(H(p,q)\)就称为交叉熵: \[H(p,q)=\sum_i p_i \cdot \l…

反向传播算法-损失函数&激活函数

在监督学习中,传统的机器学习算法优化过程是采用一个合适的损失函数度量训练样本输出损失,对损失函数进行优化求最小化的极值,相应一系列线性系数矩阵W,偏置向量b即为我们的最终结果.在DNN中,损失函数优化极值求解的过程一般采用梯度下降法.牛顿法或拟牛顿法等迭代方法来迭代完成.对DNN的损失函数用梯度下降法进行迭代优化求极小值的过程即为反向传播算法,可以使用多种损失函数和激活函数. 1. 均方差损失函数+Sigmoid激活函数 Sigmoid激活函数的表达式为: σ(z)的函数图像如下: 对于Sigm…

强化学习(十六) 深度确定性策略梯度(DDPG)

在强化学习(十五) A3C中,我们讨论了使用多线程的方法来解决Actor-Critic难收敛的问题,今天我们不使用多线程,而是使用和DDQN类似的方法:即经验回放和双网络的方法来改进Actor-Critic难收敛的问题,这个算法就是是深度确定性策略梯度(Deep Deterministic Policy Gradient,以下简称DDPG). 本篇主要参考了DDPG的论文和ICML 2016的deep RL tutorial. 1. 从随机策略到确定性策略从DDPG这个名字看,它是由D(Dee…

使用CNN做数字识别和人脸识别

上次写的一层神经网络也都贴这里了. 我有点困,我先睡觉,完了我再修改这个代码写法不太符合工业代码的规范,仅仅是用来学习的的.还望各位见谅 import sys,ossys.path.append(os.pardir)import numpy as npfrom tensorflow.examples.tutorials.mnist import input_datafrom PIL import Imageimport tensorflow as tf class mmmmser: id="&…

Tensorflow之多元线性回归问题（以波士顿房价预测为例）

一.根据波士顿房价信息进行预测,多元线性回归+特征数据归一化 #读取数据 %matplotlib notebook import tensorflow as tf import matplotlib.pyplot as plt import numpy as np import pandas as pd #能快速读取常规大小的文件.Pandas能提供高性能.易用的数据结构和数据分析工具 from sklearn.utils import shuffle #随机打乱工具,将原有序列打乱,返回一个全…