深度视觉盛宴——CVPR 2016

小编按: 计算机视觉和模式识别领域顶级会议CVPR 2016于六月末在拉斯维加斯举行.微软亚洲研究院在此次大会上共有多达15篇论文入选,这背后也少不了微软亚洲研究院的实习生的贡献.大会结束之后,小编第一时间邀请参与了本次大会的张弛.张婷和张祥雨三位同学,与我们分享了他们眼中的CVPR大会.参加CVPR大会是一种什么样的体验?CVPR论文是如何写成的?看完你就知道! 作者简介 2016"> 张弛(论文:Joint Multiview Segmentation and Localization…

（转）CVPR 2016 Visual Tracking Paper Review

CVPR 2016 Visual Tracking Paper Review 本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072659 http://blog.csdn.net/ben_ben_niao/article/details/52078727 做了一段时间的跟踪,最近CVPR大会也过了一段时间了,这次将CVPR2016跟踪的文章做一次总结,主要是对paper的方法,创新,改进等方面进行介绍和总结.具体的实现细…

浅析"Sublabel-Accurate Relaxation of Nonconvex Energies" CVPR 2016 Best Paper Honorable Mention

今天作了一个paper reading,感觉论文不错,马克一下~ CVPR 2016 Best Paper Honorable Mention "Sublabel-Accurate Relaxation of Nonconvex Energies" 研究视觉问题的同学都知道,视觉问题很多都是多标签的问题,在进行优化的时候,我们都可以把他们转化为能量函数的形式,由数据项和平滑项组成.这些能量函数可以用变分的形式进行表达,当能量函数的项是非凸的话,一般使用梯度下降迭代的方法进行近似求解,有…

CVPR 2016 paper reading (3)

DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations, Ziwei Liu, Ping Luo, Shi Qiu, Xiaogang Wang, Xiaoou Tang, in CVPR 2016. 这篇文章接收了一个large-scale的带有完善标注的服装数据集DeepFashion. 它包含超过800,000张图片,标注有大量的attributes,clothing land…

CVPR 2016 paper reading (2)

1. Sketch me that shoe, Qian Yu, Feng Liu, Yi-Zhe Song, Tao Xiang, Timothy M. Hospedales, Cheng Change Loy, in CVPR 2016. A unique characteristic of sketches in the context of image retrieval is that they offer inherently fine-grained visual descript…

深度学习的2016: NIPS 2016速览

With best wishes for a happy New Year! NIPS(Nerual Information Processing Systems)是人工智能.机器学习领域的顶级学术会议,恰逢深度学习火热,今年于12月7日召开的第30届NIPS 2016会议更是快成为"盛会"了--2500多篇高质量论文投稿,超过5000人的参会规模,Andrew Ng.Ian Goodfellow.Yann LeCun等深度学习领军人物云集与此. 得益于现如今互联网技术的发展,足不出户…

视觉中的深度学习方法CVPR 2012 Tutorial Deep Learning Methods for Vision

Deep Learning Methods for Vision CVPR 2012 Tutorial 9:00am-5:30pm, Sunday June 17th, Ballroom D (Full day) Rob Fergus (NYU), Honglak Lee (Michigan), Marc'Aurelio Ranzato (Google) Ruslan Salakhutdinov(Toronto), Graham Taylor(Guelph), Kai Yu(Baidu) O…

论文阅读笔记二十七：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（CVPR 2016）

论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对Faster R-CNN的解读:https://www.cnblogs.com/pursuiting/ 摘要目标检测依赖于区域proposals算法对目标的位置进行预测.SPPnet和Fast R-CNN已经减少了检测网络的运行时间.然而proposals的计算仍是一个重要的瓶颈.本文提出了一个R…

CVPR 2016 paper reading (6)

1. Neuroaesthetics in fashion: modeling the perception of fashionability, Edgar Simo-Serra, Sanja Fidler, Francesc Moreno-Noguer, Raquel Urtasun, in CVPR 2015. Goal: learn and predict how fashionable a person looks on a photograph, and suggest subtle…

[CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p.p2 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #042eee } p.p3 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "…

[译]2016年深度学习的主要进展（译自：The Major Advancements in Deep Learning in 2016）

译自:The Major Advancements in Deep Learning in 2016 建议阅读时间:10分钟 https://tryolabs.com/blog/2016/12/06/majoradvancementsdeeplearning2016/ 在过去的十多年来,深度学习一直是核心话题,2016年也不例外.本文回顾了他们认为可能会推动这个领域发展或已经对这个领域产生巨大贡献的技术.(1)无监督学习有史以来便是科研人员所面临的的主要挑战之一.由于大量产生式模型的提出,201…

深度学习基础网络 ResNet

Highway Networks 论文地址:arXiv:1505.00387 [cs.LG] (ICML 2015),全文:Training Very Deep Networks( arXiv:1507.06228 ) 基于梯度下降的算法在网络层数增加时训练越来越困难(并非是梯度消失的问题,因为batch norm解决梯度消失问题).论文受 RNN 中的 LSTM.GRU 的 gate 机制的启发,去掉每一层循环的序列输入,去掉 reset gate (不需要遗忘历史信息),仍使用 gate 控…

论文阅读笔记三十三：Feature Pyramid Networks for Object Detection(FPN CVPR 2017)

论文源址:https://arxiv.org/abs/1612.03144 代码:https://github.com/jwyang/fpn.pytorch 摘要特征金字塔是用于不同尺寸目标检测中的基本组件.但由于金字塔表征的特征需要消耗较多的内存及计算资源,因此,深度学习尽量避免使用金字塔特征.本文利用深度卷积网络中自带的多尺寸信息构建特征金字塔.本文搭建了具有横向连接的自上而下的结构FPN,从而在所有尺寸上构建高层次的语义特征.本文在Faster R-CNN的基础结构上增加了FPN结构,并…

(zhuan) 126 篇殿堂级深度学习论文分类整理从入门到应用

126 篇殿堂级深度学习论文分类整理从入门到应用 | 干货雷锋网作者: 三川 2017-03-02 18:40:00 查看源网址阅读数:66 如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:“论文那么多,从哪一篇读起?” 本文将试图解决这个问题——文章标题本来是:“从入门到绝望,无止境的深度学习论文”.请诸位备好道具,开启头悬梁锥刺股的学霸姿势. 开个玩笑. 但对非科班出身的开发者而言,读论文的确可以成为一件很…

【AI in 美团】深度学习在OCR中的应用

AI(人工智能)技术已经广泛应用于美团的众多业务,从美团App到大众点评App,从外卖到打车出行,从旅游到婚庆亲子,美团数百名最优秀的算法工程师正致力于将AI技术应用于搜索.推荐.广告.风控.智能调度.语音识别.机器人.无人配送等多个领域,帮助美团3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好. 基于AI技术,美团搭建了世界上规模最大,复杂度最高的多人.多点实时智能配送调度系统:基于AI技术,美团推出了业内第一款大规模落地的企业应用级语音交互产品,为50万骑手配备了智能语…

CVPR 2019|PoolNet:基于池化技术的显著性检测论文解读

作者 | 文永亮研究方向 | 目标检测.GAN 研究动机这是一篇发表于CVPR2019的关于显著性目标检测的paper,在U型结构的特征网络中,高层富含语义特征捕获的位置信息在自底向上的传播过程中可能会逐渐被稀释,另外卷积神经网络的感受野大小与深度是不成正比的,目前很多流行方法都是引入Attention(注意力机制),但是本文是基于U型结构的特征网络研究池化对显著性检测的改进,具体步骤是引入了两个模块GGM(Global Guidance Module,全局引导模块)和FAM(Featu…

论文：利用深度强化学习模型定位新物体(VISUAL SEMANTIC NAVIGATION USING SCENE PRIORS)

这是一篇被ICLR 2019 接收的论文.论文讨论了如何利用场景先验知识 (scene priors)来定位一个新场景(novel scene)中未曾见过的物体(unseen objects).举例来说,在「厨房」这一场景中,有一张图片显示「苹果」在冰箱的储物架上,同为水果的物体,如「橙子」,会出现在场景的哪个位置呢?论文提出了用基于强化学习的方法来定位「橙子」. 论文:VISUAL SEMANTIC NAVIGATION USING SCENE PRIORS 论文作者:Wei Yang , X…

deepfake-faceswap第一篇论文-2016摘要

核心目标:给定一个人的单张图片A,另一个人的单张图片B,在保持姿势,面部表情,视线方向,发型和光照不变的条件下,将A图片中的人物换成B图片中的人物.2016年,文章[1]实现了这个目标: 德国的蒂宾根大学L. A. Gatys小组实现了对图片艺术风格的转换[2],他们通过使用神经网络方法将高斯的星空转换成了完全不同的风格.总体思路是把图片的内容和风格定义成特征空间中的函数,这些特征空间所在的神经网络可以被训练来用作物体识别.图片的风格化过程使用的是一种比较缓慢并且消耗内存的方法,逐渐改变图像的像…

关于python深度学习网站

大数据文摘作品,转载要求见文末编译团队|姚佳灵裴迅简介 ▼ 深度学习,是人工智能领域的一个突出的话题,被众人关注已经有相当长的一段时间了.它备受关注是因为在计算机视觉(Computer Vision)和游戏(Alpha GO)等领域有超越人类能力的突破 .自上一次调查(查看调查:https://www.analyticsvidhya.com/blog/2014/06/deep-learning-attention/)以来,对于深度学习的关注又出现了大幅增加的趋势. 下图是谷歌趋势向我们…

zz深度学习论文合集大全

Pull requestsIssues Marketplace Explore Learn Git and GitHub without any code! Using the Hello World guide, you’ll start a branch, write comments, and open a pull request. Read the guide Watch 2,133 Star23,826 Fork5,417 floodsung/Dee…

深度强化学习（DRL）专栏（一）

目录: 1. 引言专栏知识结构从AlphaGo看深度强化学习 2. 强化学习基础知识强化学习问题马尔科夫决策过程最优价值函数和贝尔曼方程 3. 有模型的强化学习方法价值迭代策略迭代 4. 无模型的强化学习方法蒙特卡洛方法时序差分学习值函数近似策略搜索 5. 实战强化学习算法 Q-learning 算法 Monte Carlo Policy Gradient 算法 Actor Critic 算法 6. 深度强化学习算法 Deep Q-Networks(DQN) Deep De…

#Deep Learning回顾#之LeNet、AlexNet、GoogLeNet、VGG、ResNet

CNN的发展史上一篇回顾讲的是2006年Hinton他们的Science Paper,当时提到,2006年虽然Deep Learning的概念被提出来了,但是学术界的大家还是表示不服.当时有流传的段子是Hinton的学生在台上讲paper时,台下的机器学习大牛们不屑一顾,质问你们的东西有理论推导吗?有数学基础吗?搞得过SVM之类吗?回头来看,就算是真的,大牛们也确实不算无理取闹,是骡子是马拉出来遛遛,不要光提个概念. 时间终于到了2012年,Hinton的学生Alex Krizhevsky在寝…

手势估计- Hand Pose Estimation

http://blog.csdn.net/myarrow/article/details/51933651 1. 目前进展 1.1 相关资料 1)HANDS CVPR 2016 2)HANDS 2015 Dataset 3)CVPR 2016 4)Hand 3D Pose Estimation (Computer Vision for Augmented Reality Lab) 5)CVPR2016 Tutorial: 3D Deep…

论文笔记之：Generative Adversarial Text to Image Synthesis

Generative Adversarial Text to Image Synthesis ICML 2016 摘要:本文将文本和图像练习起来,根据文本生成图像,结合 CNN 和 GAN 来有效的进行无监督学习. Attribute Representation: 是一个非常具有意思的方向.由图像到文本,可以看做是一个识别问题:从文本到图像,则不是那么简单. 因为需要解决这两个小问题: 1. learning a text feature representation that captur…

论文笔记之：DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns

DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns CVPR 2016 本文提出一种分割图像 patch 的方法,因为细粒度的分类问题,如:行人动作识别和行人属性识别等等. Appearance Overview 本文提出一种利用 mid-level 深度视觉模式进行动作和属性分类,这是属于细粒度分类任务.我们的一个想法是:一个较好的 embedding 可以改善聚类算法的质量.我们设计了一种迭代算法,在每…

论文笔记之：Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 本文提出了一种新的CNN 框架来处理跟踪问题.众所周知,CNN在很多视觉领域都是如鱼得水,唯独目标跟踪显得有点“慢热”,这主要是因为CNN的训练需要海量数据,纵然是在ImageNet 数据集上微调后的model 仍然不足以很好的表达要跟踪地物体,因为Tracking问题的特殊性,至于怎么特殊的,且听细细道来. 目标跟踪之所以很少被 C…