GoogLeNet模型的微调

静悟生慧 2024-09-03 09:40:16 原文

我从零开始训练了GoogLeNet模型。但它没有给我带来希望的结果。
作为替代，我想对我的数据集中的GoogLeNet模型进行微调。有谁知道我应该遵循什么步骤？

采纳答案：

假设你正在尝试做图像分类。这些应该是微调模型的步骤：

1.分类层

原始分类层"loss3/classifier"输出1000个类的预测（它的mum_output设置为1000）。您需要将其替换为具有适当num_output的新图层。替换分类层：

更改图层的名称（以便当您从caffemodel文件读取原始权重时，不会与此图层的权重发生冲突）。
将num_output更改为您尝试预测的正确数量的输出类。
请注意，您需要更改所有分类图层。通常只有一个，但是GoogLeNet碰巧有三个： "loss1/classifier" ， "loss2/classifier"和"loss3/classifier" 。

2.数据

您需要创建一个新的训练数据集，其中包含您想要调整的新标签。例如，请参阅这篇文章，了解如何制作lmdb数据集。

3.你想要进行多少广泛的调谐？

微调模型时，可以训练所有模型的权重，或者选择修正一些权重（通常是较低/较深层次的过滤器），并仅训练最顶层的权重。这个选择取决于你，它通常取决于可用的训练数据量（更多的例子你可以承受更多的权重，可以进行微调）。
每个图层（包含可训练参数）都有param { lr_mult: XX } 。这个系数决定了这些权重对SGD更新的敏感程度。设置param { lr_mult: 0 }意味着你修改这个图层的权重，并且在训练过程中它们不会被改变。
相应地编辑您的train_val.prototxt 。

4.运行咖啡

运行caffe train但提供caffemodel的重量作为初始重量：

~$ $CAFFE_ROOT/build/tools/caffe train -solver /path/to/solver.ptototxt -weights /path/to/orig_googlenet_weights.caffemodel

　　

更多答案请参考GoogLeNet模型的微调。版权归stackoverflow所有，转载请保留此链接 GoogLeNet模型的微调

更多关于caffe 的细节，关注徐其华大神的系列博客，写得非常详细。

链接：http://www.cnblogs.com/denny402/tag/caffe/

GoogLeNet模型的微调的更多相关文章

Caffe-5.2-（GPU完整流程）训练（依据googlenet微调）
上一篇使用caffenet的模型微调.但由于caffenet有220M太大,測试速度太慢.因此换为googlenet. 1. 训练迭代了2800次时死机,大概20分钟. 使用的是2000次的模型. ...
DL开源框架Caffe | 模型微调（finetune）的场景、问题、技巧以及解决方案
转自:http://blog.csdn.net/u010402786/article/details/70141261 前言什么是模型的微调? 使用别人训练好的网络模型进行训练,前提是必须和别人 ...
图像分类（一）GoogLenet Inception_V1：Going deeper with convolutions
论文地址在该论文中作者提出了一种被称为Inception Network的深度卷积神经网络,它由若干个Inception modules堆叠而成.Inception的主要特点是它能提高网络中计算资源 ...
21个项目玩转深度学习：基于TensorFlow的实践详解03—打造自己的图像识别模型
书籍源码:https://github.com/hzy46/Deep-Learning-21-Examples CNN的发展已经很多了,ImageNet引发的一系列方法,LeNet,GoogLeNet ...
解读（GoogLeNet）Going deeper with convolutions
(GoogLeNet)Going deeper with convolutions Inception结构目前最直接提升DNN效果的方法是increasing their size,这里的size包 ...
[论文阅读]Going deeper with convolutions（GoogLeNet）
本文采用的GoogLenet网络(代号Inception)在2014年ImageNet大规模视觉识别挑战赛取得了最好的结果,该网络总共22层. Motivation and High Level Co ...
TensorRT加速 ——NVIDIA终端AI芯片加速用，可以直接利用caffe或TensorFlow生成的模型来predict（inference）
官网:https://developer.nvidia.com/tensorrt 作用:NVIDIA TensorRT™ is a high-performance deep learning inf ...
CNN-4: GoogLeNet 卷积神经网络模型
1.GoogLeNet 模型简介 GoogLeNet 是2014年Christian Szegedy提出的一种全新的深度学习结构,该模型获得了ImageNet挑战赛的冠军. 2.GoogLeNet 模 ...
经典分类CNN模型系列其五：Inception v2与Inception v3
经典分类CNN模型系列其五:Inception v2与Inception v3 介绍 Inception v2与Inception v3被作者放在了一篇paper里面,因此我们也作为一篇blog来对其 ...

随机推荐

学习LSM(Linux security module)之四:一个基于LSM的简单沙箱的设计与实现
嗯!如题,一个简单的基于LSM的沙箱设计.环境是Linux v4.4.28.一个比较新的版本,所以在实现过程中很难找到资料,而且还有各种坑逼,所以大部分的时间都是在看源码,虽然写的很烂,但是感觉收获还 ...
传统路径导出 VS 直接路径导出(oracle exp direct=y)
Oracle 传统的Export与Import依旧被保留到11g,而且9i与10g有很多依旧使用Export与Import方式进行备份与恢复的企业.从Oracle 7.3开始,传统的exp导出程序提供 ...
CodeForces - 283E Cow Tennis Tournament
Discription Farmer John is hosting a tennis tournament with his n cows. Each cow has a skill level s ...
POJ 3709 K-Anonymous Sequence（斜率优化DP）
[题目链接] http://poj.org/problem?id=3709 [题目大意] 给出一个长度为n个非严格单调递增数列,每次操作可以使得其中任意一项减一, 问现在使得数列中每项数相同的数的数量 ...
【线性基】【贪心】【独立环】bzoj2115 [Wc2011] Xor
网上到处都是题解,自己画个图也很好理解.虽然环的个数很多,但是都可以通过独立环之间异或出来,不用管. 独立环求法:生成树之后,每次向图里添加非树边(u,v),则这个独立环的异或和为sum[u]^sum ...
【斜率优化】BZOJ1010 [HNOI2008]玩具装箱toy
[题目大意] P教授有编号为1...N的N件玩具,第i件玩具长度为Ci.为了方便整理,P教授要求在一个一维容器中的玩具编号是连续的.如果将第i件玩具到第j个玩具放到一个容器中,那么容器的长度将为 x ...
[SourceTree]--记录Win10 安装SourceTree免注册登陆
记录SourceTree一次安装不成功的过程及解决办法 SourceTree简介按照官网介绍:SourceTree是一款用于Windows和Mac的免费Git客户端.简化了用户与Git存储(仓)库的 ...
在sublime执行自定义脚本
[背景] 一般项目都会有一个预处理的脚本, 在发布,或者预览效果的时候,往往要先执行脚本. 想法来自editplus 习惯了editplus的同学,都知道,可以配置自定义执行的脚本. 一般我会把它配置 ...
JavaScript中的模块化之AMD和CMD
前言: 为什么我们需要模块化开发,模块化开发的好处有哪些? 首先我们先说一下非模块化的开发方式带来的弊端. 非模块化开发中会导致一些问题的出现,变量和函数命名可能相同,会造成变量污染和冲突,并且出错时 ...
Vue基础知识总结（二）
一.解决网速慢的时候用户看到花括号标记 (1)v-cloak,防止闪烁,通常用于比较大的选择器上. 给元素添加属性v-cloak,然后style里面:[v-cloak]{display:none;} ...