深度学习之目标检测：非极大值抑制源码解析（nms）

目标检测：nms源码解析

原理：选定一个阈值，例如为0.3，然后将所有3个窗口（bounding box）按照得分由高到低排序。选中得分最高的窗口，遍历计算剩余的2窗口与该窗口的IOU，如果IOU大于阈值0.3，则窗口删除（保留得分高的窗口），再从剩余的窗口中选得分最高的，重复该过程，直到所有窗口都被计算过。

 import cv2

 import numpy as np

 import random

 def nms(dets, thresh):

     print(dets)

     x1 = dets[:, 0]

     y1 = dets[:, 1]

     x2 = dets[:, 2]

     y2 = dets[:, 3]

     score = dets[:, 4]

     #  x1=3,x2=5,习惯上计算x方向长度就

     # 是x=3、4、5这三个像素，即5-3+1=3，而不是5-3=2，所以需要加1

     areas = (x2 - x1 + 1) * (y2 - y1 + 1) #所有box面积

     order = score.argsort()[::-1] #得到score降序排列的坐标索引

     print("order",order)

     keep = []

     while order.size > 0:

         i = order[0] #最大得分box的坐标索引

         keep.append(i)

         xx1 = np.maximum(x1[i], x1[order[1:]])

         yy1 = np.maximum(y1[i], y1[order[1:]])

         xx2 = np.minimum(x2[i], x2[order[1:]])

         yy2 = np.minimum(y2[i], y2[order[1:]])

         #最高得分的boax与其他box的公共部分(交集)

         w = np.maximum(0.0, xx2 - xx1 + 1)

         h = np.maximum(0.0, yy2 - yy1 + 1) #求高和宽，并使数值合法化

         inter = w * h #其他所有box的面积

         ovr = inter / (areas[i] + areas[order[1:]] - inter)  #IOU:交并比

         #ovr小表示两个box交集少，可能是另一个物体的框，故需要保留

         inds = np.where(ovr <= thresh)[0]

         order = order[inds + 1]  #iou小于阈值的框

     return keep

 img = cv2.imread("E:\jupyterProject\Pytorch\cs75.jpg")

 img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

 dets=np.array([[500,250,1200,700,0.8], [400,200,1000,500,0.5],

                [800,150,1300,600,0.6]], np.float)

 # 设置thread为0.3

 rtn_box=nms(dets, 0.3) #0.3为faster-rcnn中配置文件的默认值

 cls_dets=dets[rtn_box, :]

 print("nms box:", cls_dets)

 img_cp1=img.copy()

 for box in cls_dets.tolist():

     x1,y1,x2,y2,score=int(box[0]),int(box[1]),int(box[2]),int(box[3]),box[-1]

     y_text=int(random.uniform(y1, y2))

     cv2.rectangle(img_cp1, (x1,y1), (x2, y2), (0, 255, 255), 2)

     cv2.putText(img_cp1, "CAR:"+str(score), (x1,y1), 2,1, (255, 0, 255))

 cv2.imshow("nms_img",img_cp1)

 # cv2.destroyAllWindows()#消除所有显示的图框

 cv2.imwrite("newcs75.jpg",img_cp1)

 cv2.waitKey(0)

IOU的阈值：threshold= 0.7

IOU的阈值：threshold= 0.3

深度学习之目标检测：非极大值抑制源码解析（nms）的更多相关文章

目标检测非极大值抑制（Non-Maximum Suppression，NMS）
非极大值抑制(Non-Maximum Suppression,NMS),顾名思义就是抑制不是极大值的元素,可以理解为局部最大搜索.也可以理解为只取置信度最高的一个识别结果. 举例: 如图所示,现在 ...
#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）
原文链接:https://www.52ml.net/20287.html 这篇博文主要讲了深度学习在目标检测中的发展. 博文首先介绍了传统的目标检测算法过程: 传统的目标检测一般使用滑动窗口的框架,主 ...
基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN,Faster R-CNN
基于深度学习的目标检测技术演进:R-CNN.Fast R-CNN,Faster R-CNN object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.obj ...
基于深度学习的目标检测（object detection）—— rcnn、fast-rcnn、faster-rcnn
模型和方法: 在深度学习求解目标检测问题之前的主流 detection 方法是,DPM(Deformable parts models), 度量与评价: mAP:mean Average Precis ...
【深度学习】目标检测算法总结（R-CNN、Fast R-CNN、Faster R-CNN、FPN、YOLO、SSD、RetinaNet）
目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息.本文对目标检测进行了整体回顾,第一部分从RCNN开始介绍基于候选区域的目标检测器,包括F ...
深度学习中目标检测Object Detection的基础概念及常用方法
目录关键术语方法 two stage one stage 共同存在问题多尺度平移不变性样本不均衡各个步骤可能出现的问题输入: 网络: 输出: 参考资料 What is detection ...
非极大值抑制Non-Maximum Suppression（NMS）
非极大值抑制(Non-Maximum Suppression,NMS) 概述非极大值抑制(Non-Maximum Suppression,NMS),顾名思义就是抑制不是极大值的元素,可以理解为局 ...
Java并发包源码学习系列：JDK1.8的ConcurrentHashMap源码解析
目录为什么要使用ConcurrentHashMap? ConcurrentHashMap的结构特点 Java8之前 Java8之后基本常量重要成员变量构造方法 tableSizeFor put ...
利用更快的r-cnn深度学习进行目标检测
此示例演示如何使用名为“更快r-cnn(具有卷积神经网络的区域)”的深度学习技术来训练对象探测器. 概述此示例演示如何训练用于检测车辆的更快r-cnn对象探测器.更快的r-nnn [1]是r-cnn ...

随机推荐

使用原生js 实现点击消失效果
JQ版 <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title ...
hbase实践之写流程
内容提要一.写入流程初始化ZooKeeper Session,建立长连接,获取META Region的地址. 获取rowkey对应的Region路由信息:来自.meta. 写入region 如何快 ...
flask调试模式
想要启用调试模式,发现安装目前网上流行的两种方式均无法在Pycharm中打开调试模式. 1)直接在对象上设置 flask 更新到1.0以后不支持使用debug =True 来开启调试模式了. Pri ...
spark-聚合算子aggregatebykey
spark-聚合算子aggregatebykey Aggregate the values of each key, using given combine functions and a neutr ...
bzoj1497: [NOI2006]最大获利（最小割）
传送门第一眼看去:好难第二眼:不就是个裸的最大权闭合子图么…… 我们从源点向所有用户连边,容量为收益,用户向自己的中转站连边,容量为INF,中转站向汇点连边,容量为费用那么总收益-最小割就是答案 ...
Peter Shirley-Ray Tracing The Next Week
Peter Shirley-Ray Tracing The Next Week(2016) 原著:Peter Shirley 英文原著地址密码: urji 第二本书主要介绍了运动模糊,BVH(层次包 ...
H5页面测试总结
前言在最近几个项目中,小编接触了较多关于H5页面的测试,H5页面的测试除了业务逻辑功能测试外,其他部分的测试方法基本是可以通用的,在此对H5页面的一些通用测试方法进行总结分享给大家. H5页面介绍 ...
ila核数据输出
在Tcl Console中输入以下命令(其中dataxxxx表示文件名,hw_ila_2则为ila窗口名): write_hw_ila_data -csv_file -force dataxxxx [ ...
.net实现浏览器大文件分片上传
以ASP.NET Core WebAPI 作后端 API ,用 Vue 构建前端页面,用 Axios 从前端访问后端 API ,包括文件的上传和下载. 准备文件上传的API #region 文件上传 ...
ACM之路（18）—— 矩阵
矩阵是干什么的呢?一句话来说就是,知道相邻两个函数的递推关系和第一个数,让你递推到第n个数.显然,如果n很大,那么一个一个递推过去是会超时的.所以矩阵就是用来解决这种快速递推的问题的. 比方说斐波那契 ...

深度学习之目标检测：非极大值抑制源码解析（nms）

深度学习之目标检测：非极大值抑制源码解析（nms）的更多相关文章

随机推荐

热门专题