Yolov3 的 OneFlow 实现

1.简介

YOLO 系列的算法(经典的v1~v3),是单阶段目标检测网络的开山鼻祖,YOLO—You only look once,表明其单阶段的特征,正是由于网络简单,单阶段的效率较快,使其区别于 Faster-RCNN 为代表的两阶段目标检测器,从一开始推出至今,便以速度快和较高的准确率而风靡目标检测领域,受到广泛使用和好评。

而Yolov3是其中的经典和集大成者(当然官方最近也推出了 Yolov4 ),其以融合了残差网络的 Darknet-53 为骨干网络,融合了多尺度,3路输出的 feature map,上采样等特点,使其模型精度和对小目标检测能力都大为提升。

本文,提供了 Yolov3 的 OneFlow 版实现,和其他版本实现的区别在于,将输出特征的 nms 过程写进了 C++ 代码中,通过自定义 user op 的方式来调用,当然,也同时支持直接使用 python 代码处理 nms。

2.快速开始

开始前,确保已正确安装了oneflow,并且在python3环境下可以成功import oneflow。

  1. git clone 此仓库到本地

git clone --recursive https://github.com/Oneflow-Inc/oneflow_yolov3.git

2. 安装 python 依赖库

pip install -r requirements.txt

3. 在项目 root 目录下,执行:

./scripts/build.sh

执行此脚本,将 cpp 代码中自定义的 op 算子编译成可调用执行的 .so 文件,将在项目路径下看到:

  • libdarknet.so
  • liboneflow_yolov3.so

预训练模型

使用了 Yolov3 原作者提供的预训练模型—yolov3.weight ,经转换后生成了 OneFlow 格式的模型。下载预训练模型:of_model_yolov3.zip ,并将解压后的 of_model 文件夹放置在项目 root 目录下,即可使用。

3. 预测/推理

运行:

sh yolo_predict.sh

或者:

sh yolo_predict_python_data_preprocess.sh

运行脚本后,将在 data/result 下生成检测后带 bbox 标记框的图片:

参数说明 - --pretrained_model 预训练模型路径

  • --label_path coco 类别标签路径(coco.name)
  • --input_dir 待检测图片文件夹路径
  • --output_dir 检测结构输出路径
  • --image_paths 单个/多个待检测图片路径,如:

--image_paths 'data/images/000002.jpg' 'data/images/000004.jpg'

训练同样很简单,准备好数据集后,只需要执行:sh yolo_train.sh即可,数据集制作过程见下文【数据集制作】部分。

4. 数据集制作

Yolov3 支持任意目标检测数据集,下面以 COCO2014 制作过程为例,介绍训练/验证所需的数据集制作,其它数据集如 PASCAL VOC 或自定义数据集等,都可以采用相同格式。

资源文件

下载 COCO2014 训练集和验证集图片,将解压后的 train2014 和 val2014 放在 data/COCO/images 目录下

(如果本地已下载过 COCO2014 数据集,可以 ln 软链接 images 至本地 train2014 和 val2014 的父目录)

准备资源文件:labels,5k.part,trainvalno5k.part

wget -c https://pjreddie.com/media/files/coco/5k.part

wget -c https://pjreddie.com/media/files/coco/trainvalno5k.part

wget -c https://pjreddie.com/media/files/coco/labels.tgz

脚本

在 data/COCO 目录下执行脚本:

# get label file

tar xzf labels.tgz

# set up image list

paste <(awk "{print \"$PWD\"}" <5k.part) 5k.part | tr -d '\t' > 5k.txt

paste <(awk "{print \"$PWD\"}" <trainvalno5k.part) trainvalno5k.part | tr -d '\t' > trainvalno5k.txt

# copy label txt to image dir

find labels/train2014/ -name "*.txt"  | xargs -i cp {} images/train2014/

find labels/val2014/   -name "*.txt"  | xargs -i cp {} images/val2014/

执行脚本将自动解压缩 labels.tgz 文件,并在当前目录下生成 5k.txt 和 trainvalno5k.txt,然后将 labels/train2014 和 labels/val2014 的所有 label.txt 文件复制到对应的训练集和验证集文件夹中( 保证图片和 label 在同一目录 )。

至此,完成整个数据集的准备过程。

5.训练

修改 yolo_train.sh 脚本中的参数,令:--image_path_file="data/COCO/trainvalno5k.txt" 并执行:

sh yolo_train.sh

即可开始训练过程,更详细的参数介绍如下:

  • --gpu_num_per_node 每台机器使用的gpu数量
  • --batch_size 批大小
  • --base_lr 初始学习率
  • --classes 目标类别数量(COCO 80;VOC 20)
  • --model_save_dir 模型存放文件夹路径
  • --dataset_dir 训练/验证集文件夹路径
  • --num_epoch 迭代总轮数
  • --save_frequency 指定模型保存的epoch间隔

说明

目前如果调用 yolo_predict.sh 执行,数据预处理部分对 darknet 有依赖

其中:

predict decoder 中调用 load_image_color、letterbox_image 函数

train
decoder 中调用 load_data_detection 函数

主要涉及以下操作,在后续的版本中会使用 OneFlow
decoder ops 替换

  • image read
  • nhwc -> nchw
  • image / 255
  • bgr2rgb
  • resize_image
  • fill_image
  • random_distort_image
  • clip image
  • random flip image and box
  • randomize_boxes
  • correct_boxes

Yolov3 的 OneFlow 实现的更多相关文章

  1. 项目版本与分支管理之阿里AoneFlow模式分析

    前言 在我前期的项目管理的经验中,一个项目需要维护多个产品及多个版本,这给版本与分支的管理增加了难度.前期没有重视,使得分支太多太乱,版本也没记录好,引发了很多的问题.在多种分支与版本的管理模式下,最 ...

  2. 模型转换[yolov3模型在keras与darknet之间转换]

    首先借助qqwweee/keras-yolo3中的convert.py和tensorrt例子yolov3_onnx,并重新编写了代码,实现将darknet格式的yolov3的yolov3.cfg和yo ...

  3. yolov3和darknet opencv版编译安装及基本测试

    版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 一.准备工作: 安装pkg-config:sudo apt-get install pkg-confi ...

  4. 基于YOLOv3和Qt5的车辆行人检测(C++版本)

    概述 YOLOv3: 车辆行人检测算法 GitHub Qt5: 制作简单的GUI OpenCV:主要用于putText.drawRec等 Step YOLOv3检测结果 Fig 1. input im ...

  5. 利用YOLOV3训练自己的数据

    写在前面:YOLOV3只有修改了源码才需要重新make,而且make之前要先make clean. 一.准备数据 在/darknet/VOCdevkit1下建立文件夹VOC2007. voc2007文 ...

  6. YOLOv3:训练自己的数据(附优化与问题总结)

    环境说明 系统:ubuntu16.04 显卡:Tesla k80 12G显存 python环境: 2.7 && 3.6 前提条件:cuda9.0 cudnn7.0 opencv3.4. ...

  7. 第十一节,利用yolov3训练自己的数据集

    1.环境配置 tensorflow1.12.0 Opencv3.4.2 keras pycharm 2.配置yolov3 下载yolov3代码:https://github.com/qqwweee/k ...

  8. AI佳作解读系列(二)——目标检测AI算法集杂谈:R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3

    1 引言 深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理.本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析. 目标检测可以理解为是物 ...

  9. 目标检测网络之 YOLOv3

    本文逐步介绍YOLO v1~v3的设计历程. YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这 ...

随机推荐

  1. Laravel 定时任务 任务调度 可手动执行

    1.创建一个命令 php artisan make:command TestCommand 执行成功后会提示: Console command created successfully. 生成了一个新 ...

  2. 「编程羽录」上线,程序员必备的这些技能你能get到嘛?

    大家好,我是小羽. 好久不见,给大家带来个好消息,小羽的全新专题「编程羽录」系列正式上新,主要是介绍一些关于面试题和经验总结的文章. 会为大家提供一些技术栈之外,程序员还需要的其他方面硬核知识,做到全 ...

  3. hdu4277 DFS+SET

    题意:       给你一些木棍,问你可以组成多少个三角形.. 思路:      直接深搜,N很小深搜无压力,也可以直接算出来,但我不会算..  #include<stdio.h> #in ...

  4. DVWA之Command Injection

    Command Injection Command Injection,即命令注入,是指通过提交恶意构造的参数破坏命令语句结构,从而达到执行恶意命令的目的.PHP命令注入攻击漏洞是PHP应用程序中常见 ...

  5. 利用ICMP进行命令控制和隧道传输

    目录 使用ICMP进行命令控制 使用ICMP搭建隧道 使用ICMP进行命令控制 攻击机:Kali  192.168.10.11 靶机:Windows 192.168.10.1 使用的工具:icmpsh ...

  6. 板载网卡MAC地址丢失后刷回方法[转]

    部份客户在进行误操作后发现网卡MAC地址全部变成0,大部客户不知道如何重新将MAC地址写回去.就此问题我们介绍一下,希望可以帮到大家.修改MAC地址时,一定要在纯DOS环境下修改.目前使用U盘DOS引 ...

  7. Portswigger web security academy:Cross-origin resource sharing (CORS)

    Portswigger web security academy:Cross-origin resource sharing (CORS) 目录 Portswigger web security ac ...

  8. Django(7)url命名的作用

    前言 为什么我们url需要命名呢?url命名的作用是什么?我们先来看一个案例 案例 我们先在一个Django项目中,创建2个App,前台front和后台cms,然后在各自app下创建urls.py文件 ...

  9. python分析《三国演义》,谁才是这部书的绝对主角(包含统计指定角色的方法)

    前面分析统计了金庸名著<倚天屠龙记>中人物按照出现次数并排序 https://www.cnblogs.com/becks/p/11421214.html 然后使用pyecharts,统计B ...

  10. Visual Lab Online —— Beta版本发布声明

    项目 内容 班级:北航2020春软件工程 博客园班级博客 作业:Beta阶段发布声明 发布声明 目录 发布方式.发布地址与运行环境要求 软件主体 浏览器扩展 Beta版本新功能 登录注册页 注册时邮箱 ...