Dynamic Filter Networks

2019-06-10 11:29:19

Paper:http://papers.nips.cc/paper/6578-dynamic-filter-networks.pdf

Code (Lasagne):https://github.com/dbbert/dfn

1. Background and Motivation:

标准卷积神经网络中,都是采用训练之后学习到的 filters,而本文则提出了一种新的学习框架,称为:Dynamic Filter Network,该网络中的 filter 是根据输入动态生成的。 这种框架更加灵活,强大,并没有提增加模型的参数个数。广泛的 filtering operation 都可以采用这种框架,包括:local spatial transformations, selective blurring 或者 adaptive feature extraction. 此外,也可以用于循环网络框架中(如 Recurrent architecture)。

该模型包含两个部分:

1). filter-generating network, 可以基于给定的输入,动态的生成 sample-specific filter network。该参数并非是固定的,像正则化模型参数;

2). dynamic filtering layer, 然后将这些 filters 应用到输入上。

这两个模块都是可微分的。作者还基于此提出了一种 dynamic local filtering layer,不但是 sample-specific,而且是 position-specific 的。这些 filters 从不同 position 以及 不同 samples 都是可变化的,允许我们在在输入上进行更多操作。该框架可以学习 spatial 和 photometric changes,因为像素不是简单的进行放置的,filters 可能在所有的近邻上进行操作。

2. Dynamic Filter Networks :

如上图所示,本文所提出的网络的结构,主要包含两个模块:一个是 filter 产生模块,另一个是 dynamic filter layer。这两个模块都是可微分的,模块的输入可以是相同的,也可以是不同的,具体跟所涉及的任务相关。为了清晰起见,作者这里解释了 model parameters 和 dynamically generated parameters 的区别:model parameters 表示预先进行初始化的 layer parameters,仅仅在 training 阶段进行更新;而 dynamic generated parameters 是 sample-specific 的,并且可以快速的进行产生,而不需要进行初始化。本文所涉及的 filter-generating network 输出的是 dynamically generated parameters,但是该网络本身的参数是属于 model parameters。

2.1 Filter-Generating Network:

滤波产生网络的输入是 $I_A$, 其输出 filter $F_{\theta}$,该滤波器可以用于输入 $I_B$ 上来产生一个输出 G,滤波器的大小决定了感受野的大小,其选择依赖于具体应用。感受野的大小还可以通过堆叠多层动态滤波模块来实现增加。

2.2 Dynamic Filtering Layer :

该模块将输入的图像或者特征 $I_B$ 作为输入,然后输出滤波之后的结果 G。

Dynamic convolutional layers: 就前文讲的,此处的卷积操作用的卷积核是动态生成的,而不是预训练产生的。其公式化表达如下:

这些 filter 是 sample-specific 的,并且是基于 filter-generating network 的输入的。动态卷积层如下图所示:

Dynamic local filtering layer :

作为上述 dynamic convolution layer 的一种拓展,dynamic local filtering layer 提供了一种更有意思的结果。在该 layer 中,filter operation 不再是 translation invariant。不同的滤波器用于输入 $I_B$ 的不同位置,这一点与传统的局部连接 layer 类似:对于输入 $I_B$ 的每一个位置 (i, j),一个特定的 local filter $F_{\theta}^{(i, j)}$ 是被用于 $I_B(i, j)$ 位置中心区域的:

用于这种 layer 的 filters 不再是 sample-specific,而是 position-specific。注意到,上述讲的 dynamic convolution 是 local dynamic filtering 的特例,其中 local filters 是在整个图像区域共享的。如下图所示,

当输入 $I_A$ 和 $I_B$ 都是图像的时候,一个很自然的方法是用卷积网络来实现 filter-generating network。也就是说,所产生的 position-specific filters 是依赖于 $I_A$ 区域中的 local image regions 的。

==

Dynamic Filter Networks的更多相关文章

  1. 论文笔记:Learning Dynamic Memory Networks for Object Tracking

    Learning Dynamic Memory Networks for Object Tracking  ECCV 2018Updated on 2018-08-05 16:36:30 Paper: ...

  2. 【CV论文阅读】Dynamic image networks for action recognition

    论文的重点在于后面approximation部分. 在<Rank Pooling>的论文中提到,可以通过训练RankSVM获得参数向量d,来作为视频帧序列的representation.而 ...

  3. (zhuan) Attention in Neural Networks and How to Use It

    Adam Kosiorek About Attention in Neural Networks and How to Use It this blog comes from: http://akos ...

  4. Attention and Augmented Recurrent Neural Networks

    Attention and Augmented Recurrent Neural Networks CHRIS OLAHGoogle Brain SHAN CARTERGoogle Brain Sep ...

  5. SPRING IN ACTION 第4版笔记-第七章Advanced Spring MVC-001- DispatcherServlet的高级配置(ServletRegistration.Dynamic、WebApplicationInitializer)

    一. 1.如想在DispatcherServlet在Servlet容器中注册后自定义一些操作,如开启文件上传功能,则可重写通过AbstractAnnotationConfigDispatcherSer ...

  6. 论文阅读笔记三十八:Deformable Convolutional Networks(ECCV2017)

    论文源址:https://arxiv.org/abs/1703.06211 开源项目:https://github.com/msracver/Deformable-ConvNets 摘要 卷积神经网络 ...

  7. 论文笔记:Dynamic Multimodal Instance Segmentation Guided by Natural Language Queries

    Dynamic Multimodal Instance Segmentation Guided by Natural Language Queries 2018-09-18 09:58:50 Pape ...

  8. 基于神经网络的混合计算(DNC)-Hybrid computing using a NN with dynamic external memory

    前言: DNC可以称为NTM的进一步发展,希望先看看这篇译文,关于NTM的译文:人工机器-NTM-Neutral Turing Machine 基于神经网络的混合计算 Hybrid computing ...

  9. 论文阅读 GloDyNE Global Topology Preserving Dynamic Network Embedding

    11 GloDyNE Global Topology Preserving Dynamic Network Embedding link:http://arxiv.org/abs/2008.01935 ...

随机推荐

  1. 用js刷剑指offer(把数组排成最小的数)

    题目描述 输入一个正整数数组,把数组里所有数字拼接起来排成一个数,打印能拼接出的所有数字中最小的一个.例如输入数组{3,32,321},则打印出这三个数字能排成的最小数字为321323. 思路 对ve ...

  2. 大规模异常滥用检测:基于局部敏感哈希算法——来自Uber Engineering的实践

    uber全球用户每天会产生500万条行程,保证数据的准确性至关重要.如果所有的数据都得到有效利用,t通过元数据和聚合的数据可以快速检测平台上的滥用行为,如垃圾邮件.虚假账户和付款欺诈等.放大正确的数据 ...

  3. Kotlin数据类深度解析与底层剖析

    今天来学习一下全新关于Kotlin的概念---数据类[data class],也是非常有用的东东,下面先来对其进行理论化的了解: 数据类其实跟java的实体类(model)很类似,像Java定义一个P ...

  4. *DataSet序列化,这段代码研究

    DataSet序列化,这段代码研究研究.学习学习. using System; using System.Collections.Generic; using System.Linq; using S ...

  5. docker相关的一些指令

    1. docker cp [容器id]:[容器文件的路径] [宿主机文件的路径] 2. docker exec -it [容器id] /bin/bash 3. docker commit -a [作者 ...

  6. Dynamics 365 on-premises 安装

    安装Dynamics 365环境配置要求: 系统版本:Windows Server 2016 SQL 版本: Microsoft SQL Server 2016 SP2 Dynamics 365 版本 ...

  7. Nginx一个server配置多个location(使用alias)

    公司测试环境使用nginx部署多个前端项目.网上查到了两个办法: 在配置文件中增加多个location,每个location对应一个项目比如使用80端口,location / 访问官网: locati ...

  8. Backpack II

    Description There are n items and a backpack with size m. Given array A representing the size of eac ...

  9. Oracle ACS 绑定变量窥视 条件

    1. ACS简介 Oracle Database 11g提供了Adaptive Cursor Sharing (ACS)功能,以克服以往不该共享的游标被共享的可能性.ACS使用两个新指标:sensit ...

  10. jsp+ ueditor word粘贴上传

    最近公司做项目需要实现一个功能,在网页富文本编辑器中实现粘贴Word图文的功能. 我们在网站中使用的Web编辑器比较多,都是根据用户需求来选择的.目前还没有固定哪一个编辑器 有时候用的是UEditor ...