Faster Rcnn训练自己的数据集过程大白话记录

声明：每人都有自己的理解，动手实践才能对细节更加理解！

参考：https://www.cnblogs.com/darkknightzh/p/10043864.html

一.算法理解

　　此处省略一万字。。。。。。。。。。。。。。。。。。

二.训练及源码理解

　　首先配置：

　　在./lib/utils文件下....运行

　　python setup.py build_ext --inplace

　　python setup.py build_ext install

　 Go to ./lib/utils文件夹下...运行

　 python setup.py build_ext --inplace

数据介绍：检测图片当中的手写体区域，图片不多自己标注了大约800张，但是图片中的手写体区域大约几千个，之前训练CTPN自己制作的数据集。
数据格式：分为3个文件夹，首先是JPEGImages(存放的训练图片，命名格式:000000.png,000001.png...等)，然后是ImageSets(里面分Layout（包括test.txt,train.txt,trainval.txt,val.txt,存放训练测试验证的文件名称）和Main即可)，另外Annotations(存放的是标注数据，xml格式的，之前数据标注在txt里面，自己转为xml标标准格式存储，或者用labelImg-master(Windows)标注，直接生成xml即可)，至此数据准备完毕。。。。。。。
模型准备：默认前段卷积网络VGG16,vgg16需要自己下载，存放在路径.data/imagenet_weights/vgg16.ckpt

训练：train.py，主要流程及核心代码如下

net.create_architecture(sess, "TRAIN", self.imdb.num_classes, tag='default')

rois, cls_prob, bbox_pred = self.build_network(sess, training)  rois为roi pooling层得到的框，cls_prob分类得分，bbox_pred框预测

net = self.build_head(is_training)  vgg16卷积层提取特征，图片缩小16倍

rpn_cls_prob, rpn_bbox_pred, rpn_cls_score, rpn_cls_score_reshape = self.build_rpn(net, is_training, initializer)  rpn网络（anchor生成与原图对应坐标），分类得分，候选框偏移等

rois = self.build_proposals(is_training, rpn_cls_prob, rpn_bbox_pred, rpn_cls_score)  通过超出图片区域，nms等筛选出合适的rois

cls_score, cls_prob, bbox_pred = self.build_predictions(net, rois, is_training, initializer, initializer_bbox) roi pooling,全连接预测等

训练自己数据修改的地方，手写体识别就设置了一个类别：chinese,在源码pascal_voc.py中修改self._classes=('__background__', 'chinese'）可以按照自己的类别进行修改，注意图片后缀格式，然后修改各种路径就可以训练了。
测试：迭代了10000次，用demo代码进行测试，数据较少，训练次数也不多，效果还可以，注意修改CLASSES = ('__background__', 'chinese') 预测结果如图所示：

Faster Rcnn训练自己的数据集过程大白话记录的更多相关文章

CTPN训练自己的数据集过程大白话记录
一.算法理解此处省略1万字.............. 二.训练及源码理解配置以下3步: 在utils文件夹和utils\bbox文件夹下创建__init__.py文件在utils\bbox文件 ...
faster rcnn训练自己的数据集
采用Pascal VOC数据集的组织结构,来构建自己的数据集,这种方法是faster rcnn最便捷的训练方式
如何才能将Faster R-CNN训练起来？
如何才能将Faster R-CNN训练起来? 首先进入 Faster RCNN 的官网啦,即:https://github.com/rbgirshick/py-faster-rcnn#installa ...
caffe学习三：使用Faster RCNN训练自己的数据
本文假设你已经完成了安装,并可以运行demo.py 不会安装且用PASCAL VOC数据集的请看另来两篇博客. caffe学习一:ubuntu16.04下跑Faster R-CNN demo (基于c ...
python3 + Tensorflow + Faster R-CNN训练自己的数据
之前实现过faster rcnn, 但是因为各种原因,有需要实现一次,而且发现许多博客都不全面.现在发现了一个比较全面的博客.自己根据这篇博客实现的也比较顺利.在此记录一下(照搬). 原博客:http ...
Fast RCNN 训练自己的数据集（3训练和检测）
转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https://github.com/YihangLou/fas ...
faster rcnn训练详解
http://blog.csdn.net/zy1034092330/article/details/62044941 py-faster-rcnn训练自己的数据:流程很详细并附代码 https://h ...
Fast R-CNN训练自己的数据集时遇到的报错及解决方案
最近使用Fast R-CNN训练了实验室的数据集,期间遇到一些报错,主要还是在配置环境上比较麻烦,但可以根据提示在网上找到解决这些错误的办法.这里我只记录一些难改的报错,以后再遇见这些时希望能尽快解决 ...
faster rcnn训练过程讲解
http://blog.csdn.net/u014696921/article/details/60321425

随机推荐

原生js实现计时器
https://www.cnblogs.com/sandraryan/ 点击开始计时,可以计次,暂停.点了暂停可以继续计时,计次,点击重置清空. <!DOCTYPE html> <h ...
2018-8-10-WPF-调试-获得追踪输出
title author date CreateTime categories WPF 调试获得追踪输出 lindexi 2018-08-10 19:16:51 +0800 2018-05-16 1 ...
hsqldb使用
1 hsqldb介绍 HyperSQL DataBase 是一个现代的关系数据库管理软件,比较彻底遵从SQL:2008标准和JDBC4规范.支持SQL:2008标准所以的核心特性和很多的可选特性. H ...
Python--day46--今日概要
P1071 01字符串的交叉安排
题目描述你有 \(n(1 \le n \le 10^6)\) 个字符'0' 和 \(m(1 \le m \le 10^6)\) 个字符'1'.你需要使用这些字符拼接成一个01字符串,使得满足如下两个 ...
程序员必备神器（FastStoneCapture）
工欲善其事,必先利其器. 作为程序员,如果我们不知道如何制作动态图或者快捷录屏.录视频等,会给人一种身怀不技的感觉:好!屁话少说,接下来我会废话连篇的介绍一款神器--------那就是FastSton ...
margin为负值的几种情况
1.margin-top为负值像素 margin-top为负值像素,偏移值相对于自身,其后元素受影响,见如下代码: 1 <!DOCTYPE html> 2 <html lang=&q ...
2018-8-10-resharper-跳转到源代码
title author date CreateTime categories resharper 跳转到源代码 lindexi 2018-08-10 19:16:52 +0800 2018-2-13 ...
2019-5-31-SharpDx-进入全屏模式
title author date CreateTime categories SharpDx 进入全屏模式 lindexi 2019-5-31 9:5:36 +0800 2019-5-30 20:1 ...
vue依赖
ajax:vue-resource moke数据:body-parser

Faster Rcnn训练自己的数据集过程大白话记录

Faster Rcnn训练自己的数据集过程大白话记录的更多相关文章

随机推荐

热门专题