Visual Detail Augmented Mapping for Small Aerial Target Detection（航片动态小目标检测）

tccbj 2024-08-21 16:39:05 原文

1.介绍

航片里小目标占总像元数不足1%，普通目标检测算法如YOLO会有很多错误，主要原因有3点：

1、航片的无关背景占多数

2、目标大小由于飞行高度和拍摄角度不同

3、航片中的小移动目标和噪音会混淆

2.方法步骤

1、多线索前景分割

　　结合了 optical flow 和 background modeling 两个方法，得到小目标概率热图，即一堆感兴趣区域。由于会存在许多噪声，用均值滤波对概率图进行处理。再对这些感兴趣框进行聚类，聚合重叠部分和两个离得很近的框

2、视觉细节增强

　　第一步做多分辨率映射，用的是线性插值，将小图片缩放到1,2,3倍，小目标的特定特征就表现出来了。再做前景增强映射，就是把第一步放大的图片重新排列位置到一张空的图上，这个空的图大小同输入网络的图，会有空隙存在，这么做有两个好处，第一是减少没东西的背景，第二是所有放大的图片都一次性进网络，不用每张图再缩放到输入网络的大小。

3、用深度网络监测

　　直接用YOLOv2进行目标检测，最后通过坐标回到原始图上。

3.网络训练

　　用普通大小的数据训练，然后去监测小目标

个人想法：这篇文章主要工作是在前景分割结合两个方法获得感兴趣区域，然后用线性插值放大感兴趣区域，最后目标检测。亮点可能就是感兴趣区域的获得了，看这篇文章的初衷是想看他怎么处理小目标的，没想到就用了线性插值放大

Visual Detail Augmented Mapping for Small Aerial Target Detection（航片动态小目标检测）的更多相关文章

目标检测--Spatial pyramid pooling in deep convolutional networks for visual recognition(PAMI, 2015)
Spatial pyramid pooling in deep convolutional networks for visual recognition 作者: Kaiming He, Xiangy ...
目标检测之vibe---ViBe（Visual Background extractor）背景建模或前景检测
ViBe算法:ViBe - a powerful technique for background detection and subtraction in video sequences 算法官网: ...
目标检测（二）SSPnet--Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognotion
作者:Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun 以前的CNNs都要求输入图像尺寸固定,这种硬性要求也许会降低识别任意尺寸图像的准确度. ...
Visual Studio 2010生成解决方案时,导致C盘空间越来越小
为了从根本上解决问题,还是去掉智能跟踪选项吧,方案: VS2010-->工具-->选项-->IntelliTrance-->将“启用IntelliTrace”勾选去掉--> ...
[代码解析]Mask R-CNN介绍与实现(转)
文章来源 DFann 版权声明:如果你觉得写的还可以,可以考虑打赏一下.转载请联系. https://blog.csdn.net/u011974639/article/details/78483779 ...
paper
1 IR 小目标检测 “Learning to detect small target A local kernel method” Xie K, Zhou T, Qiao Y, et al. Lea ...
TensorFlow练习13: 制作一个简单的聊天机器人
现在很多卖货公司都使用聊天机器人充当客服人员,许多科技巨头也纷纷推出各自的聊天助手,如苹果Siri.Google Now.Amazon Alexa.微软小冰等等.前不久有一个视频比较了Google N ...
从YOLOv1到v3的进化之路
引言:如今基于深度学习的目标检测已经逐渐成为自动驾驶,视频监控,机械加工,智能机器人等领域的核心技术,而现存的大多数精度高的目标检测算法,速度较慢,无法适应工业界对于目标检测实时性的需求,这时YOLO ...
第三十节，目标检测算法之Fast R-CNN算法详解
Girshick, Ross. “Fast r-cnn.” Proceedings of the IEEE International Conference on Computer Vision. 2 ...

随机推荐

asp.net core 一个中小型项目实战的起手式——Swagger配置
交流群:863563315 一.Swagger是什么 Swagger 是一款RESTFUL接口的.基于YAML.JSON语言的文档在线自动生成.代码自动生成的工具. 二.如何在项目中加入Swagger ...
3.MVC基础-Code First 入门完整实例
1.添加一个EF的上下文类 EFDbContext public class EFDbContext:DbContext { public EFDbContext() : base("EF ...
python PIL图像处理库
1. Introduction PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了. ...
window 命令行强制删除文件、文件夹
1. 强制删除文件文件夹和文件夹内所有文件 rd/s/q D:\app 2. 强制删除文件,文件名必须加文件后缀名 del/f/s/q D:\app.txt
造成thrift 编译构建项目失败的原因之一：thrift环境变量没设置
由于重装了系统和IDEA工具,打开原项目时使用install 构建使用thrift 协议的项目时失败.下面是说说我遇到的问题看下图,就是构建时控制台输出的日志,因为是乱码,当时没重视,就先去检查po ...
Spring Cloud原理详解
概述毫无疑问,Spring Cloud是目前微服务架构领域的翘楚,无数的书籍博客都在讲解这个技术.不过大多数讲解还停留在对Spring Cloud功能使用的层面,其底层的很多原理,很多人可能并不知晓 ...
Python学习日记(九) 装饰器函数
1.import time a.time.time() 获取到当前的时间,返回值为浮点型 import time print(time.time()) #1565422783.6497557 b.ti ...
DBUtils模块
Python 中的数据库连接池 DBUtils是Python的一个用于实现数据库连接池的模块. 有两种模式模式一:为每个线程创建一个连接,线程即使调用了close方法,也不会关闭,只是把连接重新放到 ...
HTML&CSS基础-伪类选择器
HTML&CSS基础-伪类选择器作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.html源代码 <!DOCTYPE html> <html> & ...
raw镜像与qcw2镜像互相转换
qcow2是最小使用,raw是置零使用 . raw格式是原始镜像,会直接当作一个块设备给虚拟机来使用,至于文件里面的空洞,则是由宿主机的文件系统来管理的,linux下的文件系统可以很好的支持空洞的特性 ...