darknet-yolov3模型预测框size不正确的原因

问题描述：预测框的中心位置正常，但是预测的框的width和height不正常。

解决方法：使得训练的配置cfg和测试中cfg的输入width, height, anchorbox保持一致！

问题是我在修改anchorbox时遇到的，当时训练和测试不在同一环境下，测试端没有及时更新cfg文件造成的，如下图所示：

mAP也是极低的。

修改后，检测框正常，如下图所示：

下面做下boundingbox来源分析：

首先是yolo(you only look once)中是这样定义的：

算法中明确告诉我们:boundingbox只和cell(featuremap中的)位置(Cx,Cy)以及anchorbox的(Pw,Ph)直接相关。所以我们可以重点关注这两个量。

对应到源代码中的实现主要是以下两个函数：

yolo_layer.c

...

box get_yolo_box(float *x, float *biases, int n, int index, int i, int j, int lw, int lh, int w, int h, int stride)

/*

输入参数解析：(*x 预测数据),(*biases 存放anchor数据),

(i、j 对应在feature map上的坐标),

(n 表示anchor数组的mask,为了让三个yolo_layer能取到自己对应的三组anchor, 小尺寸feature map对应大size anchor，比较好理解小尺寸特征图负责检查大尺寸目标),

(index,当前bbox对应的数据的起始下标),

(lw lh,特征图的w h),

(w h, 网络输入的w h),

(同一个bbox数据之间的stride lw*lh)

*/

{

    box b; // 网络为了每一个bbox都给出了4个坐标预测值: tx ty tw ty

    /*

    其中tx 和 ty是相对于当前feature map坐标的偏移

    除以lw&&lh 是计算出bbox坐标在图像中的比例

    */

    b.x = (i + x[index + 0*stride]) / lw;

    b.y = (j + x[index + 1*stride]) / lh;

    /*

    e^tw * biases[2*n] 表示学习到的w回归值和对应prior bbox(anchor) w的乘积得到

    bbox在网络输入size基础上的w size, 除以 net_w得到相对于网络输入图像的比例

    h的计算同理, 这部分的内容涉及到yolov3论文中的图二

    */

    b.w = exp(x[index + 2*stride]) * biases[2*n]   / w;

    b.h = exp(x[index + 3*stride]) * biases[2*n+1] / h;

    return b;

    /*补充一下，这里算出的x,y,w,h都是相对于net input size的比例*/

}
此不分为转载：

https://blog.csdn.net/wwwhp/article/details/84718089

...

int get_yolo_detections(layer l, int w, int h, int netw, int neth, float thresh, int *map, int relative, detection *dets)

{

    int i,j,n;

    float *predictions = l.output;

    if (l.batch == 2) avg_flipped_yolo(l);

    int count = 0;

    for (i = 0; i < l.w*l.h; ++i){

        int row = i / l.w;

        int col = i % l.w;

    //printf("get_yolo_detections:i =%d,row = i / l.w=%d, col = i % l.w;\n",i, row, col);

        for(n = 0; n < l.n; ++n){

            int obj_index  = entry_index(l, 0, n*l.w*l.h + i, 4);

            float objectness = predictions[obj_index];//objectness：有框的

        //printf("objectness:%f\n",objectness);

            if(objectness <= thresh) continue;

        printf("obj_index = %d,objectness:%f, thresh:%f\n",obj_index,objectness,thresh);

            int box_index  = entry_index(l, 0, n*l.w*l.h + i, 0);

            dets[count].bbox = get_yolo_box(predictions, l.biases, l.mask[n], box_index, col, row, l.w, l.h, netw, neth, l.w*l.h);//模型推理出偏移量

            dets[count].objectness = objectness;

            dets[count].classes = l.classes;

            for(j = 0; j < l.classes; ++j){

                int class_index = entry_index(l, 0, n*l.w*l.h + i, 4 + 1 + j);

                float prob = objectness*predictions[class_index];//predictions[class_index]：框中物体是class的概率，prob：置信度

        printf("get_yolo_detections1:prob=objectness*predictions[class_index] = %f * predictions[%d] = %f * %f = %f;\n",objectness,class_index,objectness,predictions[class_index],prob);

                dets[count].prob[j] = (prob > thresh) ? prob : 0;

        printf("get_yolo_detections2:[dets[count].prob[j] = (prob > thresh) ? prob : 0] = [ %f = (%f > %f) ? %f : 0];\n",dets[count].prob[j],prob,thresh,prob);

            }

            ++count;

        }

    }

    correct_yolo_boxes(dets, count, w, h, netw, neth, relative);

    return count;

}

...

如有疑问可以留言。

希望可以帮到困惑的你！

darknet-yolov3模型预测框size不正确的原因的更多相关文章

AlexeyAB DarkNet YOLOv3框架解析与应用实践（二）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(二) 版本3有什么新功能? YOLOv3使用了一些技巧来改进训练和提高性能,包括:多尺度预测.更好的主干分类器等等.全部细节都在我们的 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（一）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(一) Darknet: C语言中的开源神经网络 Darknet是一个用C和CUDA编写的开源神经网络框架.它速度快,易于安装,支持C ...
时间序列深度学习：seq2seq 模型预测太阳黑子
目录时间序列深度学习:seq2seq 模型预测太阳黑子学习路线商业中的时间序列深度学习商业中应用时间序列深度学习深度学习时间序列预测:使用 keras 预测太阳黑子递归神经网络设置.预处 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（六）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(六) 1. Tiny Darknet 听过很多人谈论SqueezeNet. SqueezeNet很酷,但它只是优化参数计数.当大多数高 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（三）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(三) ImageNet分类您可以使用Darknet为1000级ImageNet挑战赛分类图像.如果你还没有安装Darknet,你应该 ...
时间序列深度学习：状态 LSTM 模型预测太阳黑子
目录时间序列深度学习:状态 LSTM 模型预测太阳黑子教程概览商业应用长短期记忆(LSTM)模型太阳黑子数据集构建 LSTM 模型预测太阳黑子 1 若干相关包 2 数据 3 探索性数据分析 ...
tensorflow学习笔记——模型持久化的原理，将CKPT转为pb文件，使用pb模型预测
由题目就可以看出,本节内容分为三部分,第一部分就是如何将训练好的模型持久化,并学习模型持久化的原理,第二部分就是如何将CKPT转化为pb文件,第三部分就是如何使用pb模型进行预测. 一,模型持久化为 ...
AlexeyAB DarkNet YOLOv3框架解析与应用实践（五）
AlexeyAB DarkNet YOLOv3框架解析与应用实践(五) RNNs in Darknet 递归神经网络是表示随时间变化的数据的强大模型.为了更好地介绍RNNs,我强烈推荐Andrej K ...
NLP（十八）利用ALBERT提升模型预测速度的一次尝试
前沿在文章NLP(十七)利用tensorflow-serving部署kashgari模型中,笔者介绍了如何利用tensorflow-serving部署来部署深度模型模型,在那篇文章中,笔者利用k ...

随机推荐

Jedis源码浅析
1.概述 Jedis是redis官网推荐的redis java client,代码维护在github https://github.com/xetorthio/jedis. 本质上Jedis帮我们封装 ...
flex 判断对象的类型
在判断flex对象的类型之前,首先是获取对象类型,获取的方式有: mx.utils.NameUtil.getUnqualifiedClassName(object:Object):String // ...
wsl 下安装docker
docker for windows本身其实是可以直接用的,但是仍然有很多不足,比如说:权限问题.没有docker.sock文件.文件编码问题等.而win10自带的wsl可以非常完美地解决这些问题. ...
红帽学习笔记[RHCSA] 第六课[进程、服务相关]
第六课进程进程:已经启动的可执行程序的运行中的实例.每个进程都有自己的地址空间,并占用了一定的系统资源. 如何产生一个进程执行程序或命令计划任务在终端中对进程管理运行一个前台进程 [roo ...
银河麒麟v4.0.2 安装gscloud的简单过程
1. 本来想用 tar包安装 redis 结果总是报错, 提示需要make test 但是我已经make test 了所以还是使用 apt-get来安装. 2. 方式 apt-get update ...
mysql5.7 修改用户密码
修改vi /etc/my.cnf,增加skip-grant-tables可以免密码登录mysql use mysql ; update user set authentication_string=P ...
Java 14 可能带来什么新特性？
JDK/Java 13 在一个月前已经发布,该版本带来了 5 大新特性,笔者观察到其中的 Text Blocks(文本块)特性似乎被讨论最多. 文本块特性与常见的 Python "" ...
uboot第二阶段分析1
一. uboot第二阶段初识 1.1. uboot第二阶段应该做什么 a. 概括来讲uboot第一阶段主要就是初始化了SoC内部的一些部件(譬如看门狗.时钟),然后初始化DDR并且完成重定位. b. ...
tensorflow学习笔记七----------卷积神经网络
卷积神经网络比神经网络稍微复杂一些,因为其多了一个卷积层(convolutional layer)和池化层(pooling layer). 使用mnist数据集,n个数据,每个数据的像素为28*28* ...
[LeetCode] 84. 柱状图中最大的矩形
题目链接 : https://leetcode-cn.com/problems/largest-rectangle-in-histogram/ 题目描述: 给定 n 个非负整数,用来表示柱状图中各个柱 ...

darknet-yolov3模型预测框size不正确的原因

darknet-yolov3模型预测框size不正确的原因的更多相关文章

随机推荐

热门专题