DOTA数据集
航拍图像面临的问题
- 正常图像受重力作用相对固定,航拍图像的物体受拍摄角度影响
- 航拍图像的物体比例变化很大
- 某些航拍图像中小物体很密集
- 传统的数据集面临数据偏差的问题严重
好的数据集必备的几个特征
- 大量图像数据
- 单个类别有足够多的实例
- 正确定向对象说明
- 单张图片中有足够多种类的物体,以便接近于真实世界
DOTA数据集特征
15种类别:飞机、轮船、储槽、网球场、篮球场、棒球场、田径场、港口、桥、大的交通工具、小的交通工具、直升机、环岛、足球场、游泳池。其中14个主类,(交通工具算一个主类)
paper中的描述:plane, ship, storage tank, baseball diamond, tennis court, basketball court, ground track field, harbor, bridge, large vehicle, small vehicle, helicopter, roundabout, soccer ball field and basketball court.
传统的bbox检测方式通过四元组$ (x_c, y_c, w, h)$来表示,即一个没有角度的bounding box来识别object

两种思路:
- \((x_c, y_c, w, h, \theta)\),只能用来标记正方形的bbox,不能将大物体紧密的包围在bbox中
- 四个点的不规则四边形。选定初始点为第一个点,然后按照顺时针方向依次标注四个点。初始点的选择规则:物体头部或者左上角点
数据集划分:1/6的验证集、1/3的测试集和1/2的训练集,其中测试集不会公布。
图片尺寸从800X800到4000X4000不等,传统的数据集少有超过1000X1000的。
图像中的实例很多,纵横比不一。传统用于COCO检测的模型不适用(类似密集检测)。图像中相同类别的物体的大小比例不一致(基于航拍的距离变化),对模型提出了更多的挑战。细粒度的模型表现会更好,因为模型会更加关注物体的特征而不是通过大小来判别物体。
数据集中基于航拍距离的图片比例如下:

评估原型
图片太大,训练时对其进行切分。但很可能将一个完整的物体切分成几部分。对于\(U_i = \frac{a_i}{A_0} < 0.7\)的物体(可以理解为如果在切分后的图片中,这个物体只有原来的70%以下的部分了),就认为识别它是一个比较难的任务
两种任务:HBB(Horizontal bounding box) and OBB(oriented bounding box)。OBB对模型造成了很大的困难。
各种模型在DOTA数据集上的表现,左为HBB,右为OBB

结果分析
- 交通工具类和轮船类的分析结果不好,主要原因在于这类物体太小、太密集。
- 对比HBB和OBB的结果,HBB的定位精确度要比OBB差很多,证明了OBB是更加适合实际应用的方式。
- 具有较大纵横比的物体对于OBB方式的模型来说更加难回归。
- 交叉数据集验证证明了模型在DOTA数据集上的表现普遍很差,DOTA数据集的挑战性更加强。
DOTA数据集的更多相关文章
- 论文翻译 DOTA:A Large-scale Dataset for Object Detection in Aerial Images
简介:武大遥感国重实验室-夏桂松和华科电信学院-白翔等合作做的一个航拍图像数据集 摘要: 目标检测是计算机视觉领域一个重要且有挑战性的问题.虽然过去的十几年中目标检测在自然场景已经有了较重要的成就 ...
- Arbitrary-Oriented Object Detection with Circular Smooth Label(ECCV2020,旋转目标检测)
论文链接:https://arxiv.org/abs/2003.05597 code:https://github.com/Thinklab-SJTU/CSL_RetinaNet_Tensorflow ...
- Dynamic Anchor Learning for Arbitrary-Oriented Object Detection(DAL)
面向任意目标检测的动态锚点学习 摘要:面向任意的目标广泛地出现在自然场景.航空照片.遥感图像等中,因此面向任意的目标检测得到了广泛的关注.目前许多旋转探测器使用大量不同方向的锚点来实现与地面真实框的空 ...
- SCRDet——对小物体和旋转物体更具鲁棒性的模型
引言 明确提出了三个航拍图像领域内面对的挑战: 小物体:航拍图像经常包含很多复杂场景下的小物体. 密集:如交通工具和轮船类,在航拍图像中会很密集.这个DOTA数据集的发明者也提到在交通工具和轮船类的检 ...
- R2CNN模型——用于文本目标检测的模型
引言 R2CNN全称Rotational Region CNN,是一个针对斜框文本检测的CNN模型,原型是Faster R-CNN,paper中的模型主要针对文本检测,调整后也可用于航拍图像的检测中去 ...
- PIoU Loss:倾斜目标检测专用损失函数,公开超难倾斜目标数据集Retail50K | ECCV 2020 Spotlight
论文提出从IoU指标延伸来的PIoU损失函数,能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果,对anchor-based方法和anchor-free方法均适用.另外论文提供了Retail5 ...
- SSD框架训练自己的数据集
SSD demo中详细介绍了如何在VOC数据集上使用SSD进行物体检测的训练和验证.本文介绍如何使用SSD实现对自己数据集的训练和验证过程,内容包括: 1 数据集的标注2 数据集的转换3 使用SSD如 ...
- HTML5 数据集属性dataset
有时候在HTML元素上绑定一些额外信息,特别是JS选取操作这些元素时特别有帮助.通常我们会使用getAttribute()和setAttribute()来读和写非标题属性的值.但为此付出的代价是文档将 ...
- 数据集偏斜 - class skew problem - 以SVM松弛变量为例
原文 接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C.回头看一眼引入了松弛变量以后的优化问题: 注意其中C的位置,也可以回想一下C所起的 ...
随机推荐
- 21.7.1 test
\(NOI\) 模拟赛 呜呜呜 \(\cdots\cdots\) \(T1\) 类似哈夫曼编码,虽然没学过但是我依然画出了二叉树,然后尝试树形dp,并且最后还抓住了一个优化!让我兴奋地以为自己能赛时A ...
- AOP源码解析:AspectJAwareAdvisorAutoProxyCreator类的介绍
AspectJAwareAdvisorAutoProxyCreator 的类图 上图中一些 类/接口 的介绍: AspectJAwareAdvisorAutoProxyCreator : 公开了Asp ...
- hdu 1166 敌兵布阵(简单线段树or树状数组)
题意: N个工兵营地,第i个营地有ai个人. 三种操作: 1.第i个营地增加x个人. 2.第i个营地减少x个人. 3.查询第i个到第j个营地的总人数. 思路: 线段树or树状数组 代码:(树状数组) ...
- 面试题系列:用了这么多年的 Java 泛型,我竟然只知道它的皮毛
面试题:说说你对泛型的理解? 面试考察点 考察目的:了解求职者对于Java基础知识的掌握程度. 考察范围:工作1-3年的Java程序员. 背景知识 Java中的泛型,是JDK5引入的一个新特性. 它主 ...
- c++ IO库
1:为了支持使用宽字符的语言,标准库定义了一组类型和对象来操作wchar_t类型的数据.宽字符版本的类型和函数的名字以w开头.宽字符版本和普通的char版本定义在同一个头文件中,例如头文件fstrea ...
- LeetCode88 合并有序数组
1. 这道题为简单题目,但是还有需要好好思考的 2. 首先不能使用额外数组合并,不然就没得后文了 3. nums1后面有0填充,且填充数量正好是n,整个数组大小即m+n能够容纳合并后的数据 4.既然要 ...
- js分支语句
一.逻辑分支(选择结构,分支结构) 其实今天的课程才算开始涉及到逻辑 程序的三大结构 顺序结构 - 每天 代码逐行执行,一行一行自上而下执行 分支结构 有选择了,十字路口的选择,只能选择一个,如果.. ...
- 微信小程序小窗无效
这里算是踩过一个坑吧 1.自己的调试版本库是否在这个版本或者以上 2.编辑器是不能看到小窗效果的,只能在真机运行 3.播放的内容是否有效,是否能播放 4.跳转页面时内容是否处于播放状态 5.当前页面是 ...
- PLSQL批量执行SQL文件方法
当需要执行多个sql文件,或者某个脚本中,sql语句数量很多时,手动逐个逐条执行不是一个明智的选择. PLSQL为我们提供了便捷的工具.使用方式如下: [工具]--[导入表]--[SQL插入]--[选 ...
- Python基础(list与tuple)
#list 类似于数组的概念 classmates = ['傻狗1','傻狗2','傻狗3'] # print(classmates) # print(len(classmates)) # print ...