英文可查：地址

1.SoftmaxWithLoss

对一对多的分类任务计算多项逻辑斯蒂损失，并通过softmax传递预测值，来获得各类的概率分布。该层可以分解为SoftmaxLayer+MultinomialLogisticLossLayer，但它的梯度计算在数值上更为稳健。在测试时，该层可用SoftmaxLayer替代。

前向传播

bottom： 1.（N×C×H×W）维的预测得分x，N是batch数，类别总数为K=CHW，目前看到的SoftmaxWithLossLayer的bottom一般是一个InnerProduct层，所以K是写在一起的。该层将这些得分通过softmax函数（多项logistic回归模型）映射为概率分布，n∈[0, 1, …, N-1]，k、k’∈[0, 1, …, K-1]；
2.（N×1×1×1）维的标签l，，表示这个bacth中各样本的正确标签。
top：（1×1×1×1）维，对softmax输出类别概率的交叉熵分类损失。

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×H×W）维的预测得分x，反向计算微分；
2.（N×1×1×1）维的标签，忽略。
另外可参考一篇很好的介绍文章：http://blog.csdn.net/u012162613/article/details/44239919

2.EuclideanLoss

对回归任务计算欧氏距离（L2）损失，可用于最小二乘回归任务。

前向传播

bottom： 1.（N×C×H×W）维的预测，
2.（N×C×H×W）维的真实结果，
top：（1×1×1×1）维的欧氏距离损失：

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×H×W）维的预测，反向计算微分；
2.（N×C×H×W）维的预测，反向计算微分。

3.HingeLoss

对一对多的分类任务计算铰链损失。

前向传播

bottom： 1.（N×C×H×W）维的预测t，blob值的范围是，表示对K=CHW中每个类的预测得分。在SVM中，是D维特征和超平面参数的内积，因此只有一个InnerProductLayer（num_output = D）提供预测到HingeLossLayer中的网络就相当于一个SVM；
2.（N×1×1×1）维的真实标签l，。
top：（1×1×1×1）维的铰链损失：，对应于正规化，默认是L1正规化，也可以用L2正规化，。

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×H×W）维的预测得分t，反向计算微分；
2.（N×1×1×1）维的标签，忽略。

4.SigmoidCrossEntropyLoss

计算交叉熵（逻辑斯蒂）损失，通常用于以概率形式预测目标。该层可以分解为SigmoidLayer+CrossEntropyLayer，但它的梯度计算在数值上更为稳健。在测试时，该层可用SigmoidLayer替代。

前向传播

bottom： 1.（N×C×H×W）维的预测得分，是用sigmoid函数的概率预测；
2.（N×C×H×W）维的真实结果，。
top：（1×1×1×1）维的交叉熵损失：。

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×H×W）维的预测得分x，反向计算微分；
2.（N×1×1×1）维的标签，忽略。

5.MultinomialLogisticLossLayer

对一对多的分类任务计算多项逻辑斯蒂损失，直接将预测的概率分布作为输入。当预测并不是概率分布时应该用SoftmaxWithLossLayer，因为它在计算多项逻辑斯蒂损失前通过SoftmaxLayer将预测映射为分布。

前向传播

bottom： 1.（N×C×H×W）维的预测得分，blob值的范围是[0, 1]，表示对K=CHW个类中每个类的预测概率。每个预测向量之和为1，；
2.（N×1×1×1）维的标签l，，表示这个bacth中各样本的正确标签。
top：（1×1×1×1）维的多项逻辑斯蒂损失。

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×H×W）维的预测得分，反向计算微分；
2.（N×1×1×1）维的标签，忽略。

6.InfogainLoss

是MultinomialLogisticLossLayer的泛化，利用“information gain”（infogain）矩阵指定所有标签对的“value“，如果infogain矩阵一致则与MultinomialLogisticLossLayer等价。

前向传播

bottom： 1.（N×C×H×W）维的预测得分，blob值的范围是[0, 1]，表示对K=CHW个类中每个类的预测概率。每个预测向量之和为1，；
2.（N×1×1×1）维的标签l，，表示这个bacth中各样本的正确标签；
3.（1×1×K×K）维的infogain矩阵H（相应的另一个为I），若H=I则该层等价于MultinomialLogisticLossLayer。
top：（1×1×1×1）维的infogain多项逻辑斯蒂损失，指的是H的第行。

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×H×W）维的预测得分，反向计算微分；
2.（N×1×1×1）维的标签，忽略；
3.（1×1×K×K）维的infogain矩阵，忽略。

7.ContrastiveLoss

计算对比损失，其中，可用于训练siamese网络。

前向传播

bottom： 1.（N×C×1×1）维的特征；
2.（N×C×1×1）维的特征；
3.（N×C×1×1）维的二元相似度。
top：（1×1×K×K）维的对比损失。

反向传播

top：（1×1×1×1）维，该blob的微分就是loss_weight λ，λ是该层输出的系数，整个网络的损失为，这样。
bottom： 1.（N×C×1×1）维的特征a；
2.（N×C×1×1）维的特征b。

Caffe的loss layer(转)的更多相关文章

怎样在caffe中添加layer以及caffe中triplet loss layer的实现
关于triplet loss的原理.目标函数和梯度推导在上一篇博客中已经讲过了.详细见:triplet loss原理以及梯度推导.这篇博文主要是讲caffe下实现triplet loss.编程菜鸟.假 ...
Tutorial: Triplet Loss Layer Design for CNN
Tutorial: Triplet Loss Layer Design for CNN Xiao Wang 2016.05.02 Triplet Loss Layer could be a tri ...
caffe 学习(3)——Layer Catalogue
layer是建模和计算的基本单元. caffe的目录包含各种state-of-the-art model的layers. 为了创建一个caffe model,我们需要定义模型架构在一个protocol ...
Caffe源码-Layer类
Layer类简介 Layer是caffe中搭建网络的基本单元,caffe代码中包含大量Layer基类派生出来的各种各样的层,各自通过虚函数 Forward() 和 Backward() 实现自己的功能 ...
在Caffe添加Python layer详细步骤
本文主要讨论的是在caffe中添加python layer的一般流程,自己设计的test_python_layer.py层只是起到演示作用,没有实际的功能. 1) Python layer 在caff ...
caffe(6) Blob,Layer,Net 以及对应配置文件的编写
深度网络(net)是一个组合模型,它由许多相互连接的层(layers)组合而成.Caffe就是组建深度网络的这样一种工具,它按照一定的策略,一层一层的搭建出自己的模型.它将所有的信息数据定义为blob ...
【caffe】loss function、cost function和error
@tags: caffe 机器学习在机器学习(暂时限定有监督学习)中,常见的算法大都可以划分为两个部分来理解它一个是它的Hypothesis function,也就是你用一个函数f,来拟合任意一个 ...
caffe调loss方法
正文 what should I do if... ...my loss diverges? (increases by order of magnitude, goes to inf. or NaN ...
画caffe训练loss曲线
Linux下操作 1. 将loss值存储到lossInf.txt中 fName1='loss.txt' cat loss.log | grep "solver.cpp:218] Iterat ...

随机推荐

ORA-06530: 引用未初始化的组合 ;
select * FROM TABLE(fun_test_1) : ORA-06530: 引用未初始化的组合ORA-06512: 在 "PCISS.FUN_TEST_1", lin ...
php单例模式（转
假设我们需要写一个类用来操作数据库,并同时满足以下要求: ①SqlHelper类只能有一个实例(不能多)②SqlHelper类必须能够自行创建这个实例③必须自行向整个系统提供这个实例,换句话说:多个对 ...
mysql索引利弊分析
转载自:http://blog.csdn.net/linminqin/article/details/44342205 索引的利弊与如何判定,是否需要索引相信读者都知道索引能够极大地提高数据检索的 ...
微信小程序组件日历
js文件 'use strict'; let choose_year = null, choose_month = null; const conf = { data: { hasEm ...
Java 文件下载功能解决中文乱码
Html部分 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <ti ...
lucene介绍
1.https://blog.csdn.net/shuaicihai/article/details/65111523 2.https://www.cnblogs.com/rodge-run/p/65 ...
python3+selenium3+requests爬取我的博客粉丝的名称
爬取目标 1.本次代码是在python3上运行通过的 selenium3 +firefox59.0.1(最新) BeautifulSoup requests 2.爬取目标网站,我的博客:https:/ ...
LAMP 环境下添加多个虚拟主机（网站）
Ubuntu系统 #在/var/www目录下新建两个文件夹bbs和oa,执行完以上命令后,/var/www目录下有bbs.oa三个文件夹,名称与二级域名对应,分别存放三个系统的php文件,这样便于日后 ...
如何将SLIC集成到ESXi中
如何将SLIC集成到ESXi中参考 http://forums.mydigitallife.info/threads/12982-ESX-ESXi-Bios-Tools/page34?p=72183 ...
MT【127】点对个数两题之一【图论】
在平面上有$n$ 个点$S={x_1,x_2\cdots,x_n}, $ 其中任意两个点之间的距离至少为 $1$, 证明在这 $n$ 个点中距离为 $1$的点对数不超过 $3n$. ...

Caffe的loss layer(转)

英文可查：地址

1.SoftmaxWithLoss

前向传播

反向传播

2.EuclideanLoss

前向传播

反向传播

3.HingeLoss

前向传播

反向传播

4.SigmoidCrossEntropyLoss

前向传播

反向传播

5.MultinomialLogisticLossLayer

前向传播

反向传播

6.InfogainLoss

前向传播

反向传播

7.ContrastiveLoss

前向传播

反向传播

Caffe的loss layer(转)的更多相关文章

随机推荐

热门专题