PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

nowgood 2024-09-06 09:53:28 原文

URL: https://arxiv.org/abs/1608.08021
year: 2016

TL;DR

PVANet 一个轻量级多物体目标检测架构, 遵循 “less channels with more layers” 的设计原则, 通过结合 CReLU, Inception, HyperNet 3 个模块构成了一个高效的目标检测架构, 在达到了当时 SOTA.

CReLU 应用于PVANet 早期阶段, 以将计算次数减少一半而不会失去准确性。
Inception 应用于特征生成子网络的剩余部分。 Inception 模块产生不同大小的感受野的输出，因此增加了前一层中感受野大小的多样性。我们观察到堆叠 Inception 模块可以比线性卷积链更有效地捕获大小不同大小的对象。
HyperNet 采用了多尺度表示的概念，它结合了多个中间输出，因此可以同时考虑多个级别的细节和非线性。

Dataset/Algorithm/Model/

CReLU

C.ReLU的设计动机来自对CNN中的激活模式的有趣观察。在CNN早期阶段，输出节点倾向于“成对”出现，使得一个节点的激活是另一个节点的取反。根据这一观察结果，CReLU将输出通道的数量减少了一半，并通过简单地将输出与其取反Concat来使通道加倍，这可以在网络的早期阶段加速2倍而不会失去准确性。

Inception

我们发现Inception可以是用于捕获输入图像中的小对象和大对象的最具成本效益的构建块之一。要学习捕获大型物体的视觉模式，CNN的输出特征应该对应于足够大的感受野，这可以通过堆叠3x3或更大内核的卷积来轻松实现。另一方面，为了捕获小尺寸物体，输出特征应该对应于足够小的感受野，以精确地定位感兴趣的小区域。

HyperNet

多尺度表示及其融合被证明在许多最近的深度学习任务中是有效的。将细粒度细节与特征提取层中的高度抽象信息相结合，有助于以下 RPN(region proposal network) 和分类网络检测不同尺度的对象。

PVANet

Experiment Detail

Thoughts

为设计轻量级多尺度特征检测, 特征融合提供思路

PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection的更多相关文章

[C1W3] Neural Networks and Deep Learning - Shallow neural networks
第三周:浅层神经网络(Shallow neural networks) 神经网络概述(Neural Network Overview) 本周你将学习如何实现一个神经网络.在我们深入学习具体技术之前,我 ...
PVANET----Deep but Lightweight Neural Networks for Real-time Object Detection论文记录
arxiv上放出的物体检测的文章,在Pascal voc数据集上排第二.源码也已放出(https://github.com/sanghoon/pva-faster-rcnn),又可以慢慢把玩了.这篇文 ...
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week4, Deep Neural Networks
Deep Neural Network Getting your matrix dimention right 选hyper-pamameter 完全是凭经验补充阅读: cost 函数的计算公式: ...
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week1, Introduction to deep learning
整个deep learing 系列课程主要包括哪些内容 Intro to Deep learning
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week3, Neural Networks Basics
NN representation 这一课主要是讲3层神经网络下面是常见的 activation 函数.sigmoid, tanh, ReLU, leaky ReLU. Sigmoid 只用在输出0 ...
Coursera, Deep Learning 1, Neural Networks and Deep Learning - week2, Neural Networks Basics
Logistic regression Cost function for logistic regression Gradient Descent 接下来主要讲 Vectorization Logi ...
ReLU——Deep Sparse Rectifier Neural Networks
1. 摘要 ReLU 相比 Tanh 能产生相同或者更好的性能,而且能产生真零的稀疏表示,非常适合自然就稀疏的数据. 采用 ReLU 后,在大量的有标签数据下,有没有无监督预训练模型取得的最好效果是一 ...
DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks
1.Introduction DL解决VO问题:End-to-End VO with RCNN 2.Network structure a.CNN based Feature Extraction 论 ...
Combining STDP and Reward-Modulated STDP in Deep Convolutional Spiking Neural Networks for Digit Recognition
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 灵长类视觉系统激发了深度人工神经网络的发展,使计算机视觉领域发生了革命性的变化.然而,这些网络的能量效率比它们的生物学对 ...

随机推荐

十二、ITK例程-医疗图像配准的HelloWorld程序
一.说明医疗图像配准是ITK的一个重要内容,而我们今天想要说的一个程序则相当于是其中的HelloWorld程序. 程序源码位置: InsightToolkit-\Examples\Registrat ...
getOutputStream() has already been called for this response 从了解到解决
一.背景说明在tomcat的localhost.log日志中时长见到 getOutputStream() has already been called for this respon ...
观察者模式Vs发布订阅模式
1)观察者模式观察者模式通俗的讲就是我们平事件调用(click/change等等) 大家先看这个图片.我们被观察者Subject(监听某个事件)发生改变时,观察者Observer监听到没改变做出调整 ...
java之操作集合的工具类--Collections
Collections是一个操作Set.List和Map等集合的工具类. Collections中提供了大量方法对集合元素进行排序.查询和修改等操作,还提供了对集合对象设置不可变.对集合对象实现同步控 ...
Eureka工作原理及它和ZooKeeper的区别
1.Eureka 简介: Eureka 是 Netflix 出品的用于实现服务注册和发现的工具. Spring Cloud 集成了 Eureka,并提供了开箱即用的支持.其中, Eureka 又可细分 ...
Web安全测试学习笔记-SQL注入-利用concat和updatexml函数
mysql数据库中有两个函数:concat和updatexml,在sql注入时经常组合使用,本文通过学习concat和updatexml函数的使用方法,结合实例来理解这种sql注入方式的原理. con ...
c博客06-结构体&文件
1.本章学习总结 1.1 学习内容总结结构体的定义.成员的赋值: 结构体的一般定义形式(单独定义): struct 结构名 { 类型名结构体成员名1; 类型名结构体成员名2; ... 类型名结 ...
linux命令-压缩与打包
在 Linux 中可以识别的常见压缩格式有十几种,比如".zip"" .gz"" .bz2" ".tar" " ...
VUE Error: listen EADDRNOTAVAIL: address not available
vue项目运行npm run dev时出现 Error: listen EADDRNOTAVAIL: address not available ... 的错误原因:配置的IP不对解决方法:打开c ...
什么是StatefulSet
简单说来,StatefulSet其实就是一种升级版的Deployment,大体工作原理如下 1.为每个Pod名字按顺序编号,按顺序启动 # kubectl get po -o wide -l app= ...