[论文理解] Attentional Pooling for Action Recognition

【[论文理解] Attentional Pooling for Action Recognition】的更多相关文章

[论文理解] Attentional Pooling for Action Recognition

Attentional Pooling for Action Recognition 简介这是一篇NIPS的文章,文章亮点是对池化进行矩阵表示,使用二阶池的矩阵表示,并将权重矩阵进行低秩分解,从而使分解后的结果能够自底向上和自顶向下的解释,并巧用attention机制来解释,我感觉学到了很多东西,特别是张量分解等矩阵论的知识点. 基础概念低秩分解目的:去除冗余并减少模型的权值参数方法:使用两个K*1的卷积核代替掉一个K*K的卷积核原理:权值向量主要分布在一些低秩子空间,使用少量的基就可…

【CV论文阅读】Rank Pooling for Action Recognition

这是期刊论文的版本,不是会议论文的版本.看了论文之后,只能说,太TM聪明了.膜拜~~ 视频的表示方法有很多,一般是把它看作帧的序列.论文提出一种新的方法去表示视频,用ranking function的参数编码视频的帧序列.它使用一个排序函数(ranking function)主要基于这样的假设:帧的appearance的变化与时间相关,如果帧vt+1在vt后面,则定义:此外,假设同一动作的视频帧序列,学习到的排序函数的参数,应该的大致一致的.但实际上,后面的假设并没有给出严格的证明,只能说实验的…

[论文理解]Selective Search for Object Recognition

Selective Search for Object Recognition 简介 Selective Search是现在目标检测里面非常常用的方法,rcnn.frcnn等就是通过selective search方法得到候选框,然后进行分类,也就是传统的two stage方法.本篇也是我看到frcnn之后不得不看的一篇论文,大致将自己的理解记录下来,方便以后指正. Selective Search 算法目的能够得到各种大小的框由于图像中的物体可以有任意大小,所以selective sear…

论文列表 for Action recognition

要读的论文: https://www.cnblogs.com/hizhaolei/p/10565405.html 骨架动作识别论文汇总 https://blog.csdn.net/bianxuewei1238/article/details/84936883 AAAI 2018 行为识别论文概览 https://zhuanlan.zhihu.com/p/34322114 已经阅读的论文: 2019年: Action recognition based on 2D skeletons extrac…

201904Online Human Action Recognition Based on Incremental Learning of Weighted Covariance Descriptors

论文标题:Online Human Action Recognition Based on Incremental Learning of Weighted Covariance Descriptors 来源/作者机构情况: 卧龙岗大学(世界排名230~),第一次听说这个学校.竟然是在澳大利亚的一个学校.好吧,华人果然全球了李老师是本硕都是浙大的,李老师个人链接如下: https://www.uow.edu.au/~wanqing/#UOWActionDatasets 解决问题/主要思想贡献:…

论文笔记 | A Closer Look at Spatiotemporal Convolutions for Action Recognition

( 这篇博文为原创,如需转载本文请email我: leizhao.mail@qq.com, 并注明来源链接,THX!) 本文主要分享了一篇来自CVPR 2018的论文,A Closer Look at Spatiotemporal Convolutions for Action Recognition.这篇论文主要介绍了Video Classification.Action Recognition方面的工作,包括2D.3D以及混合卷积等多种方法,最重要的贡献在于提出(2+1)D的结构. 1. R…

【CV论文阅读】+【搬运工】LocNet: Improving Localization Accuracy for Object Detection + A Theoretical analysis of feature pooling in Visual Recognition

论文的关注点在于如何提高bounding box的定位,使用的是概率的预测形式,模型的基础是region proposal.论文提出一个locNet的深度网络,不在依赖于回归方程.论文中提到locnet可以很容易与现有的detection系统结合,但我困惑的是(1)它们的训练的方法,这点论文中没有明确的提到,而仅仅说用迭代的方法进行(2)到底两者的融合后两个网络的结构是怎样呢?可以看做一个多任务的系统,还是存在两个网络呢? 检测方法输入的候选bounding box(使用selective s…

【论文笔记】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition 2018-01-28 15:45:13 研究背景和动机: 行人动作识别(Human Action Recognition)主要从多个模态的角度来进行研究,即:appearance,depth,optical-flow,以及 body skeletons.这其中,动态的人类骨骼点通常是最具有信息量的,且能够和其他模态进行互补.…

Recent papers on Action Recognition | 行为识别最新论文

CVPR2019 1.An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition 作者:Chenyang Si, Wentao Chen, Wei Wang, Liang Wang, Tieniu Tan 论文链接:https://arxiv.org/abs/1902.09130 2.Improving the Performance of Unimodal Dynami…

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition (ST-GCN)

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition 摘要动态人体骨架模型带有进行动作识别的重要信息,传统的方法通常使用手工特征或者遍历规则对骨架进行建模,从而限制了表达能力并且很难去泛化. 作者提出了一个新颖的动态骨架模型ST-GCN,它可以从数据中自动地学习空间和时间的patterns,这使得模型具有很强的表达能力和泛化能力. 在Kinetics和NTU-RGBD两个数据集上a…