论文介绍ppt:https://pan.baidu.com/s/1gfDURyb Tamar, Aviv, et al. "Value iteration networks." Advances in Neural Information Processing Systems. 2016. 这篇论文是NIPS2016的最佳论文.主要看点是: 用卷积层模拟了value的迭代过程. 框架简单且具有一定的通用性 使用了注意力机制 End-to-End 个人感觉这个框架不是太通用,因为任务有点…
目录 故事背景 方法 两种加速策略 网络设计 网络优化 失败设计 回头品味 实验 数据集和数据处理 结果 第二次阅读 本文不是第一个提出early exit思想的 写作流畅 网络回顾 其他 发表在ICLR 2018,Oral. 摘要 In this paper we investigate image classification with computational resource limits at test time. Two such settings are: 1. anytime…
目录 故事背景 U-Net 具体结构 损失 数据扩充 发表在2015 MICCAI.原本是一篇医学图像分割的论文,但由于U-Net杰出的网络设计,得到了8k+的引用. 摘要 There is large consent that successful training of deep networks requires many thousand annotated training samples. In this paper, we present a network and trainin…
Relation Networks for Object Detection笔记  写在前面:关于这篇论文的背景知识,请参考我前面的两篇随笔(<关于目标检测>和<关于注意力机制>) 摘要: 所有最先进的物体检测系统仍然依赖于单独识别物体实例, 在学习过程中并没有利用它们的关系.(背景) 这个工作提出了一个目标关系模块.它通过它们的外观特征和几何图形之间的交互来同时处理一组物体,从而对它们之间的关系进行建模.它是轻量级的和就地(in-place)这里的relation module是…
目录 1. 动机 2. 相关工作 3. Non-local神经网络 3.1 Formulation 3.2 具体实现形式 3.3 Non-local块 4. 视频分类模型 4.1 2D ConvNet(C2D) 4.2 膨胀的(inflated)3D ConvNet(I3D) 4.3 Non-local network 5. 实验 本文提出non-local操作来捕捉远距离依赖.受到Non-local[4]的启发,本文中一个位置的响应(response)是所有位置特征的加权求和. 1. 动机 对…
paper download:https://arxiv.org/abs/1801.04356 本文的核心就是使用GAN网络生成新的数据. 这个总体框图,常规结构,具体是通过在appearance和pose上分离在网络设计上,作者提到了三点: 1.  为了避免网络只是单纯的Match Feature Pairs,如上图所示,只是学习Residual:,公式的意思是Source与Target 的Feature Vector的差值. 2.  Appearance和pose分开训练,pose的学习便可…
目录 摘要 故事要点 模型训练 发表在2018年CVPR. 以下对于一些专业术语的翻译可能有些问题. 摘要 有损压缩是一个优化问题,其优化目标是率失真,优化对象是编码器.量化器和解码器(同时优化). Lossy image compression can be formulated as a joint rate-distortion optimization to learn encoder, quantizer, and decoder. 其中,量化器和离散熵预测(discrete entr…
论文地址:https://128.84.21.199/abs/1703.09831 这篇论文来自于百度的机器学习研究院,作者为:徐伟.余昊男.张海超 这篇论文用了多种技术的组合: reinforcement learning, word embedding, attention, question and answer, bidirection RNN等.模型挺复杂的,但看下面这张图能够大致弄明白.要是还能加上去年VIN(NIPS2016 best paper: Value Iteration…
When a golf player is first learning to play golf, they usually spend most of their time developing a basic swing. Only gradually do they develop other shots, learning to chip, draw and fade the ball, building on and modifying their basic swing. In a…
目录 I. 基础知识 II. 早期尝试 1. Neocognitron, 1980 2. LeCun, 1989 A. 概况 B. Feature maps & Weight sharing C. 网络设计 D. 实验 3. LeNet, 1998 III. 历史性突破:AlexNet, 2012 1. Historic 2. 困难之处 3. 选择CNN 4. 本文贡献 5. 网络设计 A. ReLU B. Training on Multiple GPUs C. Local Response…