[ Continuously Update ] The Paper List of Image / Video Captioning

【[ Continuously Update ] The Paper List of Image / Video Captioning】的更多相关文章

[ Continuously Update ] The Paper List of Image / Video Captioning

Papers Published in 2018 Convolutional Image Captioning - Jyoti Aneja et al., CVPR 2018 - [ Paper Reading ] Learning to Evaluate Image Captioning - Yin Cui et al., CVPR 2018 - [ Paper Reading ] CNN+CNN: Convolutional Decoders for Image Captioning - Q…

[ Continuously Update ] The Paper List of Seq2Seq Tasks ( including Attention Mechanism )

Papers Published in 2017 Convolutional Sequence to Sequence Learning - Jonas Gehring et al., CoRR 2017 - [ Paper Reading ] ★ Attention Is All You Need - Ashish Vaswani et al., NIPS 2017 - [ Paper Reading ] ★ Papers Published in 2014 Sequence to Seque…

[ Continuously Update ] This is an Index Page.

The links below present papers in certain fields. Despite overlaps exist, their emphasis is markedly different. Each paper shows its Content and Comprehension, which is almost extracted from the paper while key points are clear. Generally, each paper…

视频描述（Video Captioning）调研

Video Analysis 相关领域介绍之Video Captioning(视频to文字描述)http://blog.csdn.net/wzmsltw/article/details/71192385 基于视频图像的信息:包括简单的用CNN(VGGNet, ResNet等)提取图像(spatial)特征,用action recognition的模型(如C3D)提取视频动态(spatial+temporal)特征先验特征:比如视频的类别,这种特征能提供很强的先验信息基于文本的特征:此处基于文…

Video Captioning 综述

1.Unsupervised learning of video representations using LSTMs 方法:从先前的帧编码预测未来帧序列相似于Sequence to sequence learning with neural networks论文方法:使用一个LSTM编码输入文本成固定表示,另一个LSTM解码成不同语言 2.Describing Videos by Exploiting Temporal Structure 该论文发表在iccv2015,是第一篇使用时间关…

视频描述（Video Captioning）近年重要论文总结

视频描述顾名思义视频描述是计算机对视频生成一段描述,如图所示,这张图片选取了一段视频的两帧,针对它的描述是"A man is doing stunts on his bike",这对在线的视频的检索等有很大帮助.近几年图像描述的发展也让人们思考对视频生成描述,但不同于图像这种静态的空间信息,视频除了空间信息还包括时序信息,同时还有声音信息,这就表示一段视频比图像包含的信息更多,同时要求提取的特征也就更多,这对生成一段准确的描述是重大的挑战. 一.long-term Recurrent…

Paper | Non-Local ConvLSTM for Video Compression Artifact Reduction

目录 1. 方法 1.1 框图 1.2 NL流程 1.3 加速版NL 2. 实验 3. 总结 [这是MFQE 2.0的第一篇引用,也是博主学术生涯的第一篇引用.最重要的是,这篇文章确实抓住了MFQE方法的不足之处,而不是像其他文章,随意改改网络罢了.虽然引的是arXiv版本,但是很开心!欢迎大家引用TPAMI版本!] 在MFQE的基础上,作者提出了一个问题:"好"帧里的块的质量就好吗?"差"帧里的块的质量就差吗?显然不一定,因为帧的好/坏是由整张图像的综合质量决定的…

paper 92：图像视觉博客资源2之MIT斯坦福CMU

收录的图像视觉(也包含机器学习等)领域的博客资源的第二部分,包含:美国MIT.斯坦福.CMU三所高校 1)这些名人大家一般都熟悉,本文仅收录了包含较多资料的个人博客,并且有不少更新,还有些名人由于分享的paper.code或者数据集不多,暂时没收录了. 2)排名按照字母顺序 3)主要按照博客的域名进行分类,不代表作者当前工作所在机构 4)更新日期有可能不是最最新的日期,供参考 1 美国 1.1 MIT 1.1.1 Antonio Torralba MIT助理教授Anto…

CVPR2016 Paper list

CVPR2016 Paper list ORAL SESSIONImage Captioning and Question Answering Monday, June 27th, 9:00AM - 10:05AM. These papers will also be presented at the following poster session 1 Deep Compositional Captioning: Describing Novel Object Categories Witho…

CVPR 2017 Paper list

CVPR2017 paper list Machine Learning 1 Spotlight 1-1A Exclusivity-Consistency Regularized Multi-View Subspace Clustering Xiaojie Guo, Xiaobo Wang, Zhen Lei, Changqing Zhang, Stan Z. Li Borrowing Treasures From the Wealthy: Deep Transfer Learning Thro…