caffe源代码分析--softmax

caffe源代码分析--softmax_layer.cpp

// Copyright 2013 Yangqing Jia

//

#include <algorithm>

#include <vector>

#include "caffe/layer.hpp"

#include "caffe/vision_layers.hpp"

#include "caffe/util/math_functions.hpp"

using std::max;

namespace caffe {

/**

 * 建立softmax网络层

 */

template <typename Dtype>

void SoftmaxLayer<Dtype>::SetUp(const vector<Blob<Dtype>*>& bottom,

      vector<Blob<Dtype>*>* top) {

  CHECK_EQ(bottom.size(), 1) << "Softmax Layer takes a single blob as input.";

  CHECK_EQ(top->size(), 1) << "Softmax Layer takes a single blob as output.";

  //输出分配空间

  (*top)[0]->Reshape(bottom[0]->num(), bottom[0]->channels(),

      bottom[0]->height(), bottom[0]->width());

  //sum_multiplier_这里都是1，用于辅助计算，能够看作一个行向量。或者行数为1的矩阵

  sum_multiplier_.Reshape(1, bottom[0]->channels(),

      bottom[0]->height(), bottom[0]->width());

  Dtype* multiplier_data = sum_multiplier_.mutable_cpu_data();

  for (int i = 0; i < sum_multiplier_.count(); ++i) {

    multiplier_data[i] = 1.;

  }

  //暂时变量scale_分配空间。大小为num,能够看作一个列向量

  scale_.Reshape(bottom[0]->num(), 1, 1, 1);

}

template <typename Dtype>

void SoftmaxLayer<Dtype>::Forward_cpu(const vector<Blob<Dtype>*>& bottom,

    vector<Blob<Dtype>*>* top) {

  const Dtype* bottom_data = bottom[0]->cpu_data();

  Dtype* top_data = (*top)[0]->mutable_cpu_data();

  Dtype* scale_data = scale_.mutable_cpu_data();

  //把输出看成是num层，每层dim个元素

  int num = bottom[0]->num();

  int dim = bottom[0]->count() / bottom[0]->num();

  memcpy(top_data, bottom_data, sizeof(Dtype) * bottom[0]->count());

  // we need to subtract the max to avoid numerical issues, compute the exp,

  // and then normalize.

  //找出每一层的最大值

  for (int i = 0; i < num; ++i) {

    scale_data[i] = bottom_data[i*dim];

    for (int j = 0; j < dim; ++j) {

      scale_data[i] = max(scale_data[i], bottom_data[i * dim + j]);

    }

  }

  // subtraction  通过矩阵相乘的方式来计算，有num层的top_data，每层元素减去该层的最大值。太巧妙了

  caffe_cpu_gemm<Dtype>(CblasNoTrans, CblasNoTrans, num, dim, 1, -1.,

    scale_data, sum_multiplier_.cpu_data(), 1., top_data);

  // C = alpha*op( A )*op( B ) + beta*C

  // Perform exponentiation 计算自然对数

  caffe_exp<Dtype>(num * dim, top_data, top_data);

  // sum after exp 每一层各自求和放到scale_data中

  caffe_cpu_gemv<Dtype>(CblasNoTrans, num, dim, 1., top_data,

      sum_multiplier_.cpu_data(), 0., scale_data);

  // Do division 每一层各自除以该层的和

  for (int i = 0; i < num; ++i) {

    caffe_scal<Dtype>(dim, Dtype(1.) / scale_data[i], top_data + i * dim);

  }

}

template <typename Dtype>

Dtype SoftmaxLayer<Dtype>::Backward_cpu(const vector<Blob<Dtype>*>& top,

    const bool propagate_down,

    vector<Blob<Dtype>*>* bottom) {

  const Dtype* top_diff = top[0]->cpu_diff();

  const Dtype* top_data = top[0]->cpu_data();

  Dtype* bottom_diff = (*bottom)[0]->mutable_cpu_diff();

  Dtype* scale_data = scale_.mutable_cpu_data();

  int num = top[0]->num();

  int dim = top[0]->count() / top[0]->num();

  memcpy(bottom_diff, top_diff, sizeof(Dtype) * top[0]->count());

  // Compute inner1d(top_diff, top_data) and subtract them from the bottom diff

  for (int i = 0; i < num; ++i) {

    scale_data[i] = caffe_cpu_dot<Dtype>(dim, top_diff + i * dim,

        top_data + i * dim);//每一层，top_diff和top_data计算内积

  }

  // subtraction  每一层bottom_diff的元素减去该层的相应的内积

  caffe_cpu_gemm<Dtype>(CblasNoTrans, CblasNoTrans, num, dim, 1, -1.,

      scale_data, sum_multiplier_.cpu_data(), 1., bottom_diff);

  // elementwise multiplication 元素各自相乘

  caffe_mul<Dtype>(top[0]->count(), bottom_diff, top_data, bottom_diff);

  return Dtype(0);

}

INSTANTIATE_CLASS(SoftmaxLayer);

}  // namespace caffe

本文作者：linger

本文链接：http://blog.csdn.net/lingerlanlan/article/details/32700431

caffe源代码分析--softmax_layer.cpp的更多相关文章

caffe源代码分析--data_layer.cpp
dataLayer作为整个网络的输入层, 数据从leveldb中取. leveldb的数据是通过图片转换过来的. 网络建立的时候. datalayer主要是负责设置一些參数,比方batchsize.c ...
caffe源代码分析--Blob类代码研究
作者:linger 转自须注明转自:http://blog.csdn.net/lingerlanlan/article/details/24379689 数据成员 shared_ptr<Sync ...
caffe源代码分析--math_functions.cu代码研究
当中用到一个宏定义CUDA_KERNEL_LOOP 在common.hpp中有. #defineCUDA_KERNEL_LOOP(i,n) \ for(inti = blockIdx.x * bloc ...
Caffe源代码中Solver文件分析
Caffe源代码(caffe version commit: 09868ac , date: 2015.08.15)中有一些重要的头文件,这里介绍下include/caffe/solver.hpp文件 ...
转：SDL2源代码分析
1:初始化(SDL_Init()) SDL简介有关SDL的简介在<最简单的视音频播放示例7:SDL2播放RGB/YUV>以及<最简单的视音频播放示例9:SDL2播放PCM>中 ...
转：ffdshow 源代码分析
ffdshow神奇的功能:视频播放时显示运动矢量和QP FFDShow可以称得上是全能的解码.编码器.最初FFDShow只是mpeg视频解码器,不过现在他能做到的远不止于此.它能够解码的视频格式已经远 ...
Android系统进程Zygote启动过程的源代码分析
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6768304 在Android系统中,所有的应用 ...
Android系统默认Home应用程序（Launcher）的启动过程源代码分析
在前面一篇文章中,我们分析了Android系统在启动时安装应用程序的过程,这些应用程序安装好之后,还需要有一个 Home应用程序来负责把它们在桌面上展示出来,在Android系统中,这个默认的Home ...
Android应用程序安装过程源代码分析
文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6766010 Android系统在启动的过程中, ...

随机推荐

ACM_巧克力
Chocolate,Chocolate Time Limit: 2000/1000ms (Java/Others) Problem Description: 都说发神喜欢吃巧克力,有一次发神徒弟买了一 ...
springMVC是什么等七个问题
[转]linux之ps命令
转自:http://www.cnblogs.com/peida/archive/2012/12/19/2824418.html Linux中的ps命令是Process Status的缩写.ps命令用来 ...
vue-cli 打包优化
1. 优化打包体积先上2个图 (上图A是优化前的各个js大小对比视图,下图B是优化后,还未完全优化完成的,不过也可以看得出来对比) 图A是3个压缩文件,包括部分图片和使用的所有js,体积都偏大图B ...
debounce还是throttle(去抖和节流)
debounce 去抖我的理解很简单,比方说window.onscroll会疯狂触发handler,此时给它一个debounce(handler, delayTime). 就是不管你延时时间内触发了 ...
設置VS2015
減少VsHub的資源占用 VsHub在某些環境下會挂,原因見這個帖子其作用簡述如下: First, the service that detects and auto-updates extensi ...
python 字典 get方法
在做项目的过程中,遇到了一个问题,数据保存到字典中,后来发现数据不对,排查了字典的构建过程,是OK的,后来怀疑是别的部分共用了这一个字典,排查代码,发现这里应该是有问题的. score = None ...
12--c完数/最大公约数/最小公倍数/素数/回文数
完数/最大公约数/最小公倍数/素数/回文数 2015-04-08 10:33 296人阅读评论(0) 收藏举报分类: C/C++(60) 哈尔滨工业大学(8) 版权声明:本文为博主原创文章 ...
HDU_1023_Train Problem II_卡特兰数
Train Problem II Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) ...
getdlgitemtext
获取控件内信息 set 设置控件内信息 oninitdialog初始化控件时的操作

caffe源代码分析--softmax_layer.cpp

caffe源代码分析--softmax_layer.cpp的更多相关文章

随机推荐

热门专题