prototxt文件是caffe的配置文件，用于保存CNN的网络结构和配置信息。prototxt文件有三种，分别是deploy.prototxt，train_val.prototxt和solver.prototxt。

1. solver.prototxt

solver.prototxt是caffe的配置文件。里面定义了网络训练时候的各种参数，比如学习率、权重衰减、迭代次数等等。

solver.prototxt文件只在网络进行训练的时候需要载入。是网络训练的一个整体的参数配置文件。

下面详细说明每一个参数所代表的意义：

 #网络模型描述文件

 #也可以用train_net和test_net来对训练模型和测试模型分别设定

 #train_net: "xxxxxxxxxx"

 #test_net: "xxxxxxxxxx"

 net: "E:/Caffe-windows/caffe-windows/examples/mnist/lenet_train_test.prototxt"

 #这个参数要跟test_layer结合起来考虑，在test_layer中一个batch是100，而总共的测试图片是10000张

 #所以这个参数就是10000/100=100

 test_iter: 100

 #每迭代500次进行一次测试

 test_interval: 500

 #学习率

 base_lr: 0.01

 #动力

 momentum: 0.9

 #type:SGD #优化算法的选择。这一行可以省略，因为默认值就是SGD，Caffe中一共有6中优化算法可以选择

 #Stochastic Gradient Descent (type: "SGD"), 在Caffe中SGD其实应该是Momentum

 #AdaDelta (type: "AdaDelta"),

 #Adaptive Gradient (type: "AdaGrad"),

 #Adam (type: "Adam"),

 #Nesterov’s Accelerated Gradient (type: "Nesterov")

 #RMSprop (type: "RMSProp")

 #权重衰减项，其实也就是正则化项。作用是防止过拟合

 weight_decay: 0.0005

 #学习率调整策略

 #如果设置为inv,还需要设置一个power, 返回base_lr * (1 + gamma * iter) ^ (- power)，其中iter表示当前的迭代次数

 lr_policy: "inv"

 gamma: 0.0001

 power: 0.75

 #每训练100次屏幕上显示一次，如果设置为0则不显示

 display: 100

 #最大迭代次数

 max_iter: 2000

 #快照。可以把训练的model和solver的状态进行保存。每迭代5000次保存一次，如果设置为0则不保存

 snapshot: 5000

 snapshot_prefix: "E:/Caffe-windows/caffe-windows/examples/mnist/models"

 #选择运行模式

 solver_mode: GPU

test_iter：表示网络的测试迭代次数。网络一次迭代将一个batchSize的图片进行测试，所以为了能将validation集中所有图片都测试一次，这个参数乘以TEST的batchSize应该等于validation集中图片总数量。即test_iter*batchSize=val_num。注：这里的test是将训练集=训练+测试，test是这里的测试。

test_interval：表示网络迭代多少次进行一次测试。一次迭代即一个batchSize的图片通过网络正向传播和反向传播的整个过程。比如这里设置的是224，即网络每迭代224次即对网络的准确率进行一次验证。一般来说，我们需要将训练集中所有图片都跑一编，再对网络的准确率进行测试，整个参数乘以网络data层（TRAIN）中batchSize参数应该等于训练集中图片总数量。即test_interval*batchSize=train_num。

base_lr：表示网络的基础学习率。学习率过高可能导致loss持续86.33333，也可能导致loss无法收敛等等问题。过低的学习率会使网络收敛慢，也有可能导致梯度损失。一般我们设置为0.01。

display: 每多少次显示在窗口一次。

max_iter: 网络的最大迭代次数。训练集中的图片当然不能只训练一次就算了，要反复多次的进行训练，所以这个参数应该要大一些。

lr_policy: 学习率变化。

gamma: 学习率变化比率。一般不改。

momentum: 学习的参数。一般不改。

weight_decay: 学习的参数。一般不改。

stepsize: 每多少次学习率递减。这里是迭代2218次学习率递减。

snapshot: 每多少次保存一次学习的结果。即caffemodel。

solver_mode: 设置使用GPU还是CPU进行学习训练。

net: 网络结构的文件路径。

solver_type: 优化算法的选择，一共有六种可选：SGD、AdaDelta、AdaGrad、Adam、Nesterov和RMSProp。默认为SGD。

2. deploy.prototxt和train_val.prototx

这两个文件是caffe的网络结构文件。train_val.prototx是训练时候的网络结构，deploy.prototxt用于发布（即测试时候的网络结构）。这两个文件中内容基本一致，但是存在一些细微区别：

在train_val.prototx中网络结构的data层有两种，分别为TRAIN和TEST。顾名思义，TRAIN是网络训练时后的数据结构，TEST是网络做验证时候的数据结构。一般来说TRAIN中的batchSize比TEST中的要大一些。
在train_val.prototx中的卷积层（Convolution）中存在学习率和权重衰减的参数，而deploy.prototxt文件中则没有这些参数（有些deploy.prototxt中仍然有这些参数，但是对测试不起任何作用）。

由于train_val.prototx包含了deploy.prototxt文件中所有的参数定义，所以下面以train_val.prototx文件为例，详细说明每个参数的意义。这里以经典的AlexNet网络为例：

1 data层

 layer {

   name: "train-data"

   type: "Data"

   top: "data"

   top: "label"

   include {

     phase: TRAIN

   }

   transform_param {

     mirror: true

     crop_size: 227

     mean_file: "./mean.binaryproto"

   }

   data_param {

     source: "./train_db"

     batch_size: 128

     backend: LMDB

   }

 }

name: 这一层的名字。

type:这一层的类型。

top: 这一层所连接的上一层。注意，网络是从下往上生长的。最底层是数据层，越往上特征越抽象。

phase: TRAIN 表示这一层是训练时候网络的定义。

mirror:是否使用镜像。

crop_size:将输入数据裁剪为227。

mean_file:均值文件的路径。

source:训练集的路径。

batch_size:一次迭代输入的图片数量。

backend:数据集的格式。

2. Convolution层

 layer {

   name: "conv1"

   type: "Convolution"

   bottom: "data"

   top: "conv1"

   param {

     lr_mult: 1.0

     decay_mult: 1.0

   }

   param {

     lr_mult: 2.0

     decay_mult: 0.0

   }

   convolution_param {

     num_output: 96

     kernel_size: 11

     stride: 4

     weight_filler {

       type: "gaussian"

       std: 0.01

     }

     bias_filler {

       type: "constant"

       value: 0.0

     }

   }

 }

lr_mult: 学习率。这里有两个学习率，分别是filter和bias的学习率。

decay_mult:：衰减系数。同样有两个，与学习率对应。

num_output:：这一层输出的特征图个数。即改成用多少个卷积核去对输入做卷积操作。

kernel_size：卷积核的尺寸。

stride：卷积的步长。

weight_filler {
type: "gaussian"
std: 0.01
}

整个参数是表示使用高斯方法初始化滤波器参数。这里是使用均值为0，方差为0.01的高斯核。

bias_filler {
type: "constant"
value: 0.0
}

整个参数表示使用constant方法初始化偏置。即初始偏置设置为0。

补充

训练的时候使用的是 caffe-windows\Build\x64\Release\caffe.exe 对 solver.prototxt 模型进行训练。

mnist对图片进行预处理转换使用的是 caffe-windows\Build\x64\Debug\convert_mnist_data.exe

分类测试使用的是 E:\caffe\caffe-windows\Build\x64\Debug\classification.exe

计算均值使用的是 caffe-windows\Build\x64\Debug\compute_image_mean.exe ，输入是lmdb，输出均值文件xxxx.binaryproto

caffemodel和solverstate

在caffe训练完网络之后，会生成两个文件一个caffemodel和solberstate，caffemodel是各层的参数，也就是训练之后的网络模型最重要的文件，而 solverstate则是快照，就是可以通过该文件继续进行迭代（类似于断点续传）。

这两个文件的位置请看你训练网络的 solver.prototxt文件，这里面的 snapshot_prefix字段里写了文件生成的位置。

caffe(1) 网络结构层参数详解的更多相关文章

Oracle10g数据泵impdp参数详解--摘自网络
Oracle10g数据泵impdp参数详解 2011-6-30 12:29:05 导入命令Impdp • ATTACH 连接到现有作业, 例如 ATTACH [=作业名]. • C ...
Nginx主配置参数详解，Nginx配置网站
1.Niginx主配置文件参数详解 a.上面博客说了在Linux中安装nginx.博文地址为:http://www.cnblogs.com/hanyinglong/p/5102141.html b.当 ...
iptables参数详解
iptables参数详解搬运工:尹正杰注:此片文章来源于linux社区. Iptalbes 是用来设置.维护和检查Linux内核的IP包过滤规则的. 可以定义不同的表,每个表都包含几个内部的链,也 ...
mha配置参数详解
mha配置参数详解: 参数名字是否必须参数作用域默认值示例 hostname Yes Local Only - hostname=mysql_server1, hostname=192.168 ...
mysql5.6主从参数详解
mysql5.6的主从相当的不错,增加了不少参数,提升了主从同步的安全和效率,以下是mysql5.6主从参数详解. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 ...
PHP curl 参数详解
PHP curl参数详解,分享一下. curl_setopt (PHP 4 >= 4.0.2) curl_setopt -- 为CURL调用设置一个选项描述 bool curl_setopt ...
Nginx 主配置文件参数详解
Nginx 主配置文件参数详解 Nginx 安装完毕后,会有响应的安装目录,安装目录里 nginx.conf 为 nginx 的主配置文件, ginx 主配置文件分为 4 部分,main(全局配置). ...
以太坊客户端Geth命令用法-参数详解
Geth在以太坊智能合约开发中最常用的工具(必备开发工具),一个多用途的命令行工具. 熟悉Geth可以让我们有更好的效率,大家可收藏起来作为Geth命令用法手册. 本文主要是对geth help的翻译 ...
Spark参数详解一（Spark1.6）
Spark参数详解 (Spark1.6) 参考文档:Spark官网在Spark的web UI在"Environment"选项卡中列出Spark属性.这是一个很有用的地方,可以检查 ...

随机推荐

rsync来传输文件(可断点续传)
scp传文件的话如果出错就得重新来过, 用rsync可以实现断点上传的功能大概就是这样用: rsync -P --rsh=ssh home.tar 192.168.205.34:/home/h ...
ing在写作中到底怎么用
改关静留的作业中我还得改英文摘要.于是有个地方用了ing.顺便查了一下. http://www.yygrammar.com/Article/201408/3677.html -ing分词用作状语时有九 ...
C# 对象初始化器和集合初始化器
/// <summary>/// 图书类/// </summary>public class Book { /// <summary> /// 图书 ...
windows2008 虚拟机64位的操作系统安装32位的应用程序
64位的操作系统安装32位的应用程序: 安装成功但是使用有问题报错: 最终解决: 在一台物理机的win7上面安装该软件. 然后把安装好的文件全部拷贝到win2008虚拟机上面启动,使用多ok了! ...
用SqlDataReader返回多个结果集
using System; using System.Data; using System.Data.SqlClient; namespace Northwind { class Program { ...
python自动化报错
今天使用python.然而遇见了报错.抓狂的一笔.有说path写错的,有说是...网上查到的资料也是很少.后来突然发现,页面上我暂时能看到的元素可以定位并进行操作.看不到的无法进行...ps此时我没有 ...
【python爬虫和正则表达式】爬取表格中的的二级链接
开始进公司实习的一个任务是整理一个网页页面上二级链接的内容整理到EXCEL中,这项工作把我头都搞大了,整理了好几天,实习生就是端茶送水的.前段时间学了爬虫,于是我想能不能用python写一个爬虫一个个 ...
栈(stack)--c实现(使用双链表)
是不是直接贴代码不太好,我竟然不知道说什么. 写这个考虑的问题,或者是纠结的问题是这个头指针怎么处理,也就是栈的顶部,最后采用的是初始化第一个栈空间浪费掉,栈顶是有元素的.好像应该去学习下画图,没图不 ...
解决wps的ppt演示不能打开的问题libbz2.so.1.0
安装 wps-office-10.1.0.5707-1.a21.x86_64 无法打开ppt 其他正常
JavaScript系列——数组元素左右移动N位算法实现
引言在自己刚刚毕业不久的时候,去了一家公司面试,面试官现场考了我这道题,我记忆深刻,当时没有想到思路,毫无疑问被面试官当成菜鸟了.最近刚好在研究数组的各种算法实现,就想到这道题,可以拿来实现一下,纪 ...

caffe(1) 网络结构层参数详解