DataLayer是把数据从文件导入到网络的层，从网络定义prototxt文件可以看一下数据层定义

layer {

  name: "data"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  transform_param {

    mirror: true

    crop_size: 224

    mean_value: 104

    mean_value: 117

    mean_value: 123

  }

  data_param {

    source: "examples/imagenet/ilsvrc12_train_lmdb"

    batch_size: 32

    backend: LMDB

  }

}

l

数据层包括了文件位置、文件类型、bath_size大小、图片变换等一些参数。可以看书，datalayer之后有top，没有bottom，即它是最底层的，它的forward运算只是负责把数据填充到top即可，并不使用bottom。

在caffe中数据层不仅仅限于DataLayer，因为常常使用DataLayer导入数据，这里只是阅读DataLayer部分。

数据层相关代码定义在data_layers.hpp中，DataLayer是从其他类派生出来的，一层一层来阅读。除了用到了datalayer相关的类，还用到了InternalThread，用来封装了线程，使用线程函数来取数据；类BlockingQueue是一个阻塞队列，用来辅助取数据；类DataReader，用来从文件读数据。

BaseDataLayer

BaseDataLayer直接从Layer派生出来。其成员变量有

  TransformationParameter transform_param_;//具体在protobuf中

  shared_ptr<DataTransformer<Dtype> > data_transformer_;//和输入数据转换相关。流入scale,crop,mirror等

  bool output_labels_;//是否有标签，无标签可以是无监督学习

TransformationParameter是图像变换一些相关的参数，例如图像缩放、镜像变换、crop、减去均值等操作。

DataTransformer类实现了图像变换的函数。

Batch

类Batch是和批相关的类，只是把2个数据结构封装为一个，把数据和标签对应起来。

template <typename Dtype>

class Batch {

 public:

  Blob<Dtype> data_, label_;

};

BasePrefetchingDataLayer

类BasePrefetchingDataLayer派生自BaseDataLayer和InternalThread。其中InternalThread是封装了线程，通过虚函数InternalThreadEntry来执行线程函数，用一个单独的线程函数来取数据。

成员变量为：

  Batch<Dtype> prefetch_[PREFETCH_COUNT];

  BlockingQueue<Batch<Dtype>*> prefetch_free_;

  BlockingQueue<Batch<Dtype>*> prefetch_full_;

  Blob<Dtype> transformed_data_;//用来辅助实现图片变换操作

PREFETCH_COUNT的大小，程序设为3，为了提前填充free队列。两个阻塞队列，逻辑功能比较简单：从free队列取数据结构，填充数据结构放到full队列；从full队列取数据，使用数据，清空数据结构，放到free队列。还有一个Blob结构，用来当做中间变量辅助图像变换。

虚函数InternalThreadEntry是线程执行的函数，用来取数据

//这里是取数据的线程

template <typename Dtype>

void BasePrefetchingDataLayer<Dtype>::InternalThreadEntry() {

#ifndef CPU_ONLY

  cudaStream_t stream;

  if (Caffe::mode() == Caffe::GPU) {

    CUDA_CHECK(cudaStreamCreateWithFlags(&stream, cudaStreamNonBlocking));

  }

#endif

  try {

    while (!must_stop()) {

      Batch<Dtype>* batch = prefetch_free_.pop();//从free_队列去数据结构

      load_batch(batch);//取数据，填充数据结构。在其派生类实现的

#ifndef CPU_ONLY

      if (Caffe::mode() == Caffe::GPU) {

        batch->data_.data().get()->async_gpu_push(stream);//异步，把数据同步到GPU，使用Syncedmem->async_gpu_push

        CUDA_CHECK(cudaStreamSynchronize(stream));

      }

#endif

      prefetch_full_.push(batch);//把数据放到full_队列

    }

  } catch (boost::thread_interrupted&) {

    // Interrupted exception is expected on shutdown

  }

#ifndef CPU_ONLY

  if (Caffe::mode() == Caffe::GPU) {

    CUDA_CHECK(cudaStreamDestroy(stream));

  }

#endif

}

数据层的forward函数不进行计算，不使用bottom，只是准备数据，填充到top

template <typename Dtype>

void BasePrefetchingDataLayer<Dtype>::Forward_cpu(

    const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top) {

  Batch<Dtype>* batch = prefetch_full_.pop("Data layer prefetch queue empty");//从full队列取数据

  // Reshape to loaded data.

  top[0]->ReshapeLike(batch->data_);//调整top大小，一次读取一个batch大小的数据

  // Copy the data。把数据拷贝到top中

  caffe_copy(batch->data_.count(), batch->data_.cpu_data(),

             top[0]->mutable_cpu_data());

  DLOG(INFO) << "Prefetch copied";

  if (this->output_labels_) {//如果有标签，也要把标签拷贝到top中

    // Reshape to loaded labels.

    top[1]->ReshapeLike(batch->label_);

    // Copy the labels.

    caffe_copy(batch->label_.count(), batch->label_.cpu_data(),

        top[1]->mutable_cpu_data());

  }

  prefetch_free_.push(batch);//用过的数据结构，放回free队列

}

DataLayer

DataLayer是真正在网络中使用的类，派生自BasePrefetchingDataLayer。成员变量为：

DataReader reader_;

DataReader负责从硬盘读数据到一个队列，之后提供给data_layer使用.即使并行运行多个solver，也只有一个线程来读数据，这样可以确保'顺序'取数据，不同的solver取到的数据不同.

DataReader的没有bottom，top中，如果没有标签，blob数量为1；有标签blob数量为2。

虚函数load_batch，一次导入一个batch_size大小的数据；之后进行DataTransformer变换。

caffe源码阅读(3)-Datalayer的更多相关文章

Caffe源码阅读(1) 全连接层
Caffe源码阅读(1) 全连接层发表于 2014-09-15 | 今天看全连接层的实现.主要看的是https://github.com/BVLC/caffe/blob/master/src ...
caffe源码阅读
参考网址:https://www.cnblogs.com/louyihang-loves-baiyan/p/5149628.html 1.caffe代码层次熟悉blob,layer,net,solve ...
caffe源码阅读(1)-数据流Blob
Blob是Caffe中层之间数据流通的单位,各个layer之间的数据通过Blob传递.在看Blob源码之前,先看一下CPU和GPU内存之间的数据同步类SyncedMemory:使用GPU运算时,数据要 ...
caffe源码阅读（一）convert_imageset.cpp注释
PS:本系列为本人初步学习caffe所记,由于理解尚浅,其中多有不足之处和错误之处,有待改正. 一.实现方法首先,将文件名与它对应的标签用 std::pair 存储起来,其中first存储文件名,s ...
caffe源码阅读(2)-Layer
神经网络是由层组成的,深度神经网络就是层数多了.layer对应神经网络的层.数据以Blob的形式,在不同的layer之间流动.caffe定义的神经网络已protobuf形式定义.例如: layer { ...
caffe源码阅读(1)_整体框架和简介（摘录）
原文链接:https://www.zhihu.com/question/27982282 1.Caffe代码层次.回答里面有人说熟悉Blob,Layer,Net,Solver这样的几大类,我比较赞同. ...
caffe 源码阅读
bvlc:Berkeley Vision and Learning Center. 1. 目录结构 models(四个文件夹均有四个文件构成,deploy.prototxt, readme.md, s ...
caffe中batch norm源码阅读
1. batch norm 输入batch norm层的数据为[N, C, H, W], 该层计算得到均值为C个,方差为C个,输出数据为[N, C, H, W]. <1> 形象点说,均值的 ...
源码阅读经验谈-slim,darknet,labelimg,caffe(1)
本文首先谈自己的源码阅读体验,然后给几个案例解读,选的例子都是比较简单.重在说明我琢磨的点线面源码阅读方法.我不是专业架构师,是从一个深度学习算法工程师的角度来谈的,不专业的地方请大家轻拍. 经常看别 ...

随机推荐

Exception in thread "main" java.lang.ClassNotFoundException: 解决方法
[root@h1 ~]# hadoop jar W1.jar hdfs://h1:9000/hello hdfs://h1:9000/cmd Exception in thread "mai ...
HDOJ-ACM1017(JAVA)
问题描述: 简单来说,就是输入N,然后输入N个数据块,一个数据块包含(n,m),并计算0 < a < b < n 且 (a^2+b^2 +m)/(ab) 为整数.其中a,b只要符合 ...
LeetCode:Restore IP Address
93. Restore IP Addresses Given a string containing only digits, restore it by returning all possible ...
UVa11404 - Palindromic Subsequence(区间DP+打印路径)
题目大意给定一个字符串,要求你删除尽量少的字符,使得原字符串变为最长回文串,并把回文串输出,如果答案有多种,则输出字典序最小的题解有两种解法,第一种是把字符串逆序,然后求两个字符串的LCS,并记 ...
Codeforces 295C Greg and Friends
BFS+DP.dp[i][j][0]表示有i个50kg,j个100kg的人在左岸,dp[i][j][1]表示有i个50kg,j个100kg的人在右岸.用BFS求最短路的时候记录到达该状态的可能情况. ...
Yii框架CGridView columns中使用数组或变量传值
继续Yii框架的学习与使用,CGridView对于网站后台而言十分有用处,可以很快速地实现数据列表显示,并集成排序,搜索等功能,很巧妙. 今天,在项目中遇到了状态显示问题,在controller中定义 ...
hdoj 1977 Consecutive sum II
Consecutive sum II Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Other ...
【转】C++的面象对象总结
转自:http://www.cnblogs.com/icemoon1987/archive/2012/10/01/2709572.html 1. 面向对象:对象.类.继承 2. 构造函数: 类的数 ...
GNU LIBC源代码学习之strcmp
比較两个字符串我的代码块 #include <string.h> int my_strcmp(const char* s1,const char * s2) { if((s1==NULL ...
Mac下安装cocos2d-x环境
安装后xcode之后,下载cocos2dx压缩包,解压通过中断cd到cocos2dx文件夹内输入下行命令 sudo ./install-templates-xcode.sh 执行成功后打开xcod ...