如何评价Dual Path Networks(DPN)?

论文链接:https://arxiv.org/pdf/1707.01629v1.pdf
在ImagNet-1k数据集上,浅DPN超过了最好的ResNeXt-101(64×4d),具有26%更小的模型尺寸,25%的计算成本和8%的更低的内存消耗

5 个回答

CV、ML、DL
 
1、针对视觉识别任务的“网络工程”一直是研究的重点,其重在设计更为高效的网络拓扑结构,一方面考虑更好的特征表示学习,另一方面尽可能减少计算复杂度和内存消耗。比如之前的典型代表AlexNet,VGGnet,GoogLeNet,ResNet,ResNeXt,Inception-ResNet,WRNnet,DenseNet,SqueezeNet等。
2、DPN是一种结合了ResNet和DenseNet优势的新型卷积网络结构。深度残差网络通过残差旁支通路再利用特征,但残差通道不善于探索新特征。密集连接网络通过密集连接通路探索新特征,但有高冗余度。
3、论文从数学表达上对ResNet、DenseNet和HORNN的关系进行了表示,经证明,当连接在层中共享时残差网可看作密集连接网络,当权重在各步中共享时密集连接网络是高阶RNN。在之前只是从图示上感受各种神经网络模型结构中各层的连接关系,并未深入。
4、就实验结果而言,DPN 中的特征共享机制和探索新特征的灵活性被证明,DPN作为主干网络,其在图像分类、目标检测、语义分割任务都达到很好的效果。
刚看了这篇论文,对细节还没理解透,权当做个笔记。
PS.新加坡国立大学(NUS)和奇虎 360 组成的 NUS-Qihoo_DPNs (DET)在目标检测任务取得不错成绩。而今年也是最后一届基于ImageNet的ILSVRC挑战赛,是不是表明分类检测任务已经取得相对完善的表现?之后可能更侧重于语义和行为关系方向?
 
深度学习,图像算法
 

谢邀。现在优秀的算法很多,也有很多研究者在结合一些优秀的算法思考能不能碰撞出美丽的火花,DPN算是将DenseNet和ResNext结合得不错的算法,以ResNext算法为主框架,引入DenseNet的思想不是空穴来风,背后的数学含义更值得思考,没有理论支撑的话,蒙头融合模型很多时间知识浪费时间。

 
技术,码农
 

结合了ResNext和DenseNet

不过我在K40上测试,DPN98的训练速度只有8.64 samples/sec;resnext101(64*4d)却有9.31 samples/sec。

当然,显存占用和模型大小确实是DPN98要小于resnext101(64*4d)的。

25%的计算成本在哪里体现呢?

(答:显存小,增大batchsize,可以增加计算的有效性,加大samples/sec的值)测试是K40 DPN可以达到0.10s resnext101要0.13,DPN的模型也要小一些;提升还是有的,应该主要是训练过程中的数据处理影响了时间。

from:https://www.zhihu.com/question/62282589

Dual Path Networks(DPN)——一种结合了ResNet和DenseNet优势的新型卷积网络结构。深度残差网络通过残差旁支通路再利用特征,但残差通道不善于探索新特征。密集连接网络通过密集连接通路探索新特征,但有高冗余度。的更多相关文章

  1. [Network Architecture]DPN(Dual Path Network)算法详解(转)

    https://blog.csdn.net/u014380165/article/details/75676216 论文:Dual Path Networks 论文链接:https://arxiv.o ...

  2. keras搭建密集连接网络/卷积网络/循环网络

    输入模式与网络架构间的对应关系: 向量数据:密集连接网络(Dense层) 图像数据:二维卷积神经网络 声音数据(比如波形):一维卷积神经网络(首选)或循环神经网络 文本数据:一维卷积神经网络(首选)或 ...

  3. 【转载】 DeepMind发表Nature子刊新论文:连接多巴胺与元强化学习的新方法

    原文地址: baijiahao.baidu.com/s?id=1600509777750939986&wfr=spider&for=pc 机器之心 18-05-15   14:26 - ...

  4. 新的 Windows Azure 网络安全性白皮书

    下载新的 Windows Azure 网络安全性白皮书. Windows Azure 网络提供了将虚拟机安全连接到其他虚拟机所需的基础结构,以及云和内部部署数据中心之间的网桥. 本白皮书旨在挖掘这些内 ...

  5. 为什么每次app访问服务器都建立新连接 导致服务器大量连接疯涨

    运维发现服务器有大量连接不释放,而且每次app访问都会建立新连接. netstat -antlp |grep ESTAB|grep 8080|wc -l    (访问服务器8080端口的已建立的连接数 ...

  6. 【12c】12c RMAN新特性之通过网络远程恢复数据库(RESTORE/Recover from Service)

    [12c]12c RMAN新特性之通过网络远程恢复数据库(RESTORE/Recover from Service) 通过网络远程恢复数据库(Restore/Recover from Service) ...

  7. Delphi使用ADO连接网络数据库,断网后重连问题

    原始文章: https://blog.csdn.net/blog_jihq/article/details/11737699# 使用TADOConnection对象连接网络数据库(以MySQL为例), ...

  8. httpUrlConnection连接网络的用法(用到了handle传递消息,在主线程中更新UI)

    由于httpclient在Android5.0以后已经过时,所以官方推荐使用httpUrlConnection来连接网络,现将该连接的基本方法展示,如下 注意:记得加入<uses-permiss ...

  9. “ping”命令的原理就是向对方主机发送UDP数据包,HTTP在每次请求结束后都会主动释放连接,因此HTTP连接是一种“短连接”

    Socket  是一套建立在TCP/IP协议上的接口不是一个协议 应用层:  HTTP  FTP  SMTP  Web 传输层:  在两个应用程序之间提供了逻辑而不是物理的通信(TCP  UDP) T ...

随机推荐

  1. javascript的window.open()具体解释

    通过button打开一个新窗体.并在新窗体的状态栏中显示当前年份. 1)在主窗体中应用下面代码加入一个用于打开一个新窗体的button: <body> <script type=&q ...

  2. Amazon DynamoDB, 面向互联网应用的高性能、可扩展的NoSQL数据库

    DynamoDB是一款全面托管的NoSQL数据库服务.客户能够很easy地使用DynamoDB的服务.同一时候享受到高性能,海量扩展性和数据的持久性保护. DynamoDB数据库是Amazon在201 ...

  3. jquery代码小片段

    1. 使用jQuery来切换样式表 //找出你希望切换的媒体类型(media-type),然后把href设置成新的样式表. $(‘link[media="screen"]‘).at ...

  4. js向后台传递对象

    js: }; $.ajax({ url: "/.../...", type: "POST", async: false, data: JSON.stringif ...

  5. easyui datagrid自己定义操作列

    通过formatter方法给Jquery easyui 的datagrid 每行添加操作链接 我们都知道Jquery的EasyUI的datagrid能够加入而且自己定义Toolbar. 这样我们选择一 ...

  6. jQuery--基础(查询标签)

    浅谈jQuery使用背景 jQuery是使用原生js写成的一个库,使用简单,提高开发效率.在用js冗杂的代码解决的问题中,大部分都可以用jQuery来快速解决. 例如: js中查询网页中ID为&quo ...

  7. jquery插件获取事件类型

    //需要在使用函数时传入event关键字 $('[name=lprice]').change(function(event){ $('[name=lprice]').validate({ event: ...

  8. java操作pdf

    使用pdf模板生成pdf 1,工具 Adobe Acrobat X Pro 2,pom文件配置 <dependency> <groupId>com.itextpdf</g ...

  9. session 购物车

    package session; import java.io.IOException;import java.util.ArrayList;import java.util.List; import ...

  10. 【caffe】Caffe的Python接口-官方教程-01-learning-Lenet-详细说明(含代码)

    01-learning-Lenet, 主要讲的是 如何用python写一个Lenet,以及用来对手写体数据进行分类(Mnist).从此教程可以知道如何用python写prototxt,知道如何单步训练 ...