【引言】 最近在用可变卷积的rfcn 模型迁移训练自己的数据集, MSRA官方使用的MXNet框架

环境搭建及配置:http://www.cnblogs.com/andre-ma/p/8867031.html

一 参数修改:

1.1  ~/Deformable-ConvNets/experiments/rfcn/cfgs/resnet_v1_101_voc0712_rfcn_dcn_end2end_ohem.yaml  文件中修改两个参数 (yaml文件包含对应训练脚本的一切配置信息和超参数

一个使用GPU个数  :

gpus: '0,1'   表示用两块GPU训练

另一个是样本类别数

NUM_CLASSES: 5    样本类别数需 + 1   因为有背景

还有要修改使用的数据集

image_set: 2007_trainval    单单使用VOC2007  若是 image_set: 2007_trainval+2012_trainval  则用VOC2007 和 VOC2012两个数据集

1.2 修改  ~/Deformable-ConvNets/lib/dataset/pascal_voc.py 文件中的样本标签类别

self.classes = ['__background__', 'tiger_beetle', 'scarab', 'stinkbug','moth']  和上面对应,加上背景一共为5类

二 数据集准备及制作

2.1 获取数据,这个自己准备,可以用爬虫在互联网上爬取,或用其他方式收集,推荐几个图片爬虫 : 百度图片爬虫   必应图片爬虫

2.2 标注图片信息,在做目标检测时需要coco数据集或VOC数据集,可用labelImg等图像标注工具标注图片:labelImg链接:https://github.com/tzutalin/labelImg

【这里简单介绍下VOC数据格式】  参考:https://blog.csdn.net/julialove102123/article/details/78330752

VOC数据集的组织架构如下:

  • VOC2007的目录结构为:

    ├── Annotations  xml文件
    ├── ImageSets   txt文件
    └── JPEGImages 图片

  • ImageSets的目录结构为:

    ├── Layout
    ├── Main
    └── Segmentation

LabelImg可在多个平台下配置,但要注意各软件依赖的版本号:通常是python=3.5  pyqt=4  依赖lxml

Ubuntu16.04  配置labelImg教程:https://blog.csdn.net/lightningqw/article/details/78944941   (ubuntu系统下确实是不能用中文,结果发现在windows下以上的方法可以带中文)

2.3 排查并删除所有错误jpg格式

通过后缀名来判断jpg格式文件虽然简单,但是有时候会出错,尤其是从互联网上获取的图片,其质量更是难以保证。

python的PIL工具提供对jpg格式文件的判断方法:https://blog.csdn.net/qiyuanxiong/article/details/77943578

(ps: 删除不合格jpg时,记得要对应删除xml文件信息哦~)

2.3 生成4个txt

train.txt  val.txt  trainval.txt  test.txt     四txt:生成及介绍:https://blog.csdn.net/Bankeey/article/details/76595884

train:val:test  =  1: 1: 2    trainval是train和val的并集,即  train:val:trainval = 1:1:2  【训练、验证、测试流程详解】

如何制作自己的VOC2007数据集:https://www.jianshu.com/p/b498a8a5a4f4

三 迁移训练

熟悉可变卷积Deformable-ConvNets 的老铁们,可知在experiments文件夹下是不同模型的project

如本实验使用rfcn模型迁移训练,cd  Deformable-ConvNets目录,执行下面代码,开始训练!

python experiments/rfcn/rfcn_end2end_train_test.py --cfg experiments/rfcn/cfgs/resnet_v1_101_voc0712_rfcn_dcn_end2end_ohem.yaml

四 异常及解决

当且数据和配置文件就绪时,模型可正常训练;但在测试时,却报了如下异常:

Traceback (most recent call last):
File "experiments/faster_rcnn/rcnn_end2end_train_test.py", line , in <module>
test.main()
File "experiments/faster_rcnn/../../faster_rcnn/test.py", line , in main
args.vis, args.ignore_cache, args.shuffle, config.TEST.HAS_RPN, config.dataset.proposal, args.thresh, logger=logger, output_path=final_output_path)
File "experiments/faster_rcnn/../../faster_rcnn/function/test_rcnn.py", line , in test_rcnn
pred_eval(predictor, test_data, imdb, cfg, vis=vis, ignore_cache=ignore_cache, thresh=thresh, logger=logger)
File "experiments/faster_rcnn/../../faster_rcnn/core/tester.py", line , in pred_eval
info_str = imdb.evaluate_detections(all_boxes)
File "experiments/faster_rcnn/../../faster_rcnn/../lib/dataset/pascal_voc.py", line , in evaluate_detections
self.write_pascal_results(detections)
File "experiments/faster_rcnn/../../faster_rcnn/../lib/dataset/pascal_voc.py", line , in write_pascal_results
dets = all_boxes[cls_ind][im_ind]
IndexError: list index out of range

解决:

(1) 删除 ./data/cache  所有内容,

cd /root/Deformable-ConvNets/data
rm -rf cache/

(2) 删除对应output中的的临时结果文件 【假设:faster_rcnn模型出现了该问题,在output文件夹下faster_rcnn模型对应的文件夹是rcnn】

cd /root/Deformable-ConvNets/output
rm -rf rcnn/

(3) 数据集的配置要错开

vim /root/Deformable-ConvNets/experiments/rfcn/cfgs/resnet_v1_101_voc0712_rcnn_dcn_end2end_ohem.yaml

编辑如下代码,主要是  image_set 和 test_image_set

dataset:
dataset: PascalVOC
dataset_path: "./data/VOCdevkit"
image_set: 2007_trainval
root_path: "./data"
test_image_set: 2012_test
proposal: rpn

使用voc2007做训练集,voc2012做测试集,其实voc2012是voc2007的拷贝,经测试本解决方案可行

【总结】

1.用自己的数据集迁移训练可变rfcn模型,主要核心问题是数据集,数据集要有数量质量

2.使用可变rfcn迁移训练,关键要熟悉流程,以及需要修改的文件和参数

3.遇到问题时不要慌,有时候一着急反而容易把问题复杂化,或是本来快要找到解决问题的正确方法,却因另一个小问题掩盖了真正要解决的问题

anyway:  安息为王~  :)

本文参考:https://blog.csdn.net/yiweibian/article/details/67634584

可变卷积Deforable ConvNet 迁移训练自己的数据集 MXNet框架 GPU版的更多相关文章

  1. Ubuntu16 编译源码安装MXNet 可变卷积Deformable-ConvNets GPU版

    [引言]最近接手了公司的关于虫子识别的项目,使用MXNet框架开发,但是实际用的是Deformable-ConvNets. Deformable-ConvNets为微软研究研究院提出的可变卷积网络,可 ...

  2. 【Tensorflow系列】使用Inception_resnet_v2训练自己的数据集并用Tensorboard监控

    [写在前面] 用Tensorflow(TF)已实现好的卷积神经网络(CNN)模型来训练自己的数据集,验证目前较成熟模型在不同数据集上的准确度,如Inception_V3, VGG16,Inceptio ...

  3. TensorFlow学习笔记——LeNet-5(训练自己的数据集)

    在之前的TensorFlow学习笔记——图像识别与卷积神经网络(链接:请点击我)中了解了一下经典的卷积神经网络模型LeNet模型.那其实之前学习了别人的代码实现了LeNet网络对MNIST数据集的训练 ...

  4. YOLO训练自己的数据集的一些心得

    YOLO训练自己的数据集 YOLO-darknet训练自己的数据 [Darknet][yolo v2]训练自己数据集的一些心得----VOC格式 YOLO模型训练可视化训练过程中的中间参数 项目开源代 ...

  5. 在C#下使用TensorFlow.NET训练自己的数据集

    在C#下使用TensorFlow.NET训练自己的数据集 今天,我结合代码来详细介绍如何使用 SciSharp STACK 的 TensorFlow.NET 来训练CNN模型,该模型主要实现 图像的分 ...

  6. 使用py-faster-rcnn训练自己的数据集

    https://www.jianshu.com/p/a672f702e596 本文记录了在ubuntu16.04下使用py-faster-rcnn来训练自己的数据集的大致过程. 在此之前,已经成功配置 ...

  7. 目标检测算法SSD之训练自己的数据集

    目标检测算法SSD之训练自己的数据集 prerequesties 预备知识/前提条件 下载和配置了最新SSD代码 git clone https://github.com/weiliu89/caffe ...

  8. caffe训练自己的数据集

    默认caffe已经编译好了,并且编译好了pycaffe 1 数据准备 首先准备训练和测试数据集,这里准备两类数据,分别放在文件夹0和文件夹1中(之所以使用0和1命名数据类别,是因为方便标注数据类别,直 ...

  9. 使用yolo3模型训练自己的数据集

    使用yolo3模型训练自己的数据集 本项目地址:https://github.com/Cw-zero/Retrain-yolo3 一.运行环境 1. Ubuntu16.04. 2. TensorFlo ...

随机推荐

  1. Scala中的Map使用例子

    Map结构是一种非常常见的结构,在各种程序语言都有对应的api,由于Spark的底层语言是Scala,所以有必要来了解下Scala中的Map使用方法. (1)不可变Map特点: api不太丰富 如果是 ...

  2. KiCad 如何在原理图添加元件时看到 PCB 封装?

    KiCad 如何在原理图添加元件时看到 PCB 封装? 这个功能默认是关闭,评估关闭的原因是因为 PCB 封装很大,而且在前期也没必要详细知道 PCB 封装. 但是有时修改可以看到 PCB 封装会方便 ...

  3. GlusterFS学习

    环境准备 3台机器,每个机器双网卡,每个机器还需要额外添加1个10GB的磁盘用于测试 机器系统版本是centos6.6 [root@gluster-1-1 ~]# uname -rm 2.6.32-5 ...

  4. Spring 框架的历史

    2002 年 10 月,Rod Johnson 撰写了一本名为 Expert One-on-One J2EE 设计和开发的书.本书由 Wrox出版,介绍了当时 Java 企业应用程序开发的情况,并指出 ...

  5. hadoop mapreduce 简单例子

    本例子统计 用空格分开的单词出现数量(  这个Main.mian 启动方式是hadoop 2.0 的写法.1.0 不一样 ) 目录结构: 使用的 maven : 下面是maven 依赖. <de ...

  6. 数学集合:N Z Q R C

    整数:   Zahlen(德) 复数:  Complex number 实数:  Real number 自然数: Natural number 有理数: Quotient(德,"商&quo ...

  7. 在linux环境下,php语法出错,怎样让php编译后提示编译错误,错误在哪?

    如果不具备修改php.ini的权限,可以如下:ini_set("display_errors", "On"); error_reporting(E_ALL |  ...

  8. VMware虚拟机里centos7下安装mysql5.6并授权远程连接Navicat

    这节来安装Mysql5.6,并远程授权连接本地windows的Navicat,可以根据以下步骤安装.此文章为自己收藏,必要时拿出来直接用的,有需要的友友可以查看查看的.文章图片有借助于网络的. 1.新 ...

  9. 倚天剑ss

    倚天剑ss https://my.potvpn.com/ https://trial.ssbit.win/

  10. 关于sdk>=23的android版本权限的问题

    在SDK23也就是Android6.0.1里编写调用系统通讯录读写权限的程序,在AndroidManifest.xml中,已经配置了 <uses-permission android:name= ...