1. Introduction 人脸识别受到各种因素影响,其中最重要的两个影响是 pose 和 expression, 这两个因素会对 intra-person 变化产生极大的影响, 有时候甚至会超过 inter-person 变化的影响.面对这两个挑战,许多工作可以大体被划分为两种: feature level normalization 和 image level normalization. Feature级的normalization重点在于设计对pose和expression变化更鲁棒…
0 - 背景 Facebook AI Research(FAIR)开源了一项将2D的RGB图像的所有人体像素实时映射到3D模型的技术(DensePose).支持户外和穿着宽松衣服的对象识别,支持多人同时识别,并且实时性良好. 本研究的目的是通过建立从人体的2D图像到基于表面的3D表征的密集对应(dense correspondence)来进一步推进机器对图像的理解.该任务涉及到其他一些问题,如物体检测.姿态估计.作为特例或前提的部位和实例分割.在图形处理.增强现实或者人机交互等不只需要平面关键特…
开篇第一篇就写一个paper reading吧,用markdown+vim写东西切换中英文挺麻烦的,有些就偷懒都用英文写了. Stereo DSO: Large-Scale Direct Sparse Visual Odometry with Stereo Cameras Abstract Optimization objectives: intrinsic/extrinsic parameters of all keyframes all selected pixels' depth Inte…
1. Neuroaesthetics in fashion: modeling the perception of fashionability, Edgar Simo-Serra, Sanja Fidler, Francesc Moreno-Noguer, Raquel Urtasun, in CVPR 2015. Goal: learn and predict how fashionable a person looks on a photograph, and suggest subtle…
Learning while Reading 不限于具体的书,只限于知识的宽度 这个系列集合了一周所学所看的精华,它们往往来自不只一本书 我们之所以将自然界分类,组织成各种概念,并按其分类,主要是因为我们是整个口语交流社会共同遵守的协定的参与者,这个协定以语言的形式固定下来.除非赞成这个协定中规定的有关语言信息的组织和分类,否则我们根本无法交谈. ——Benjamin Lee Whorf Learning and Asking 为什么选择面向对象? 机器语言.汇编语言.面向过程的语言,通过一层层…
论文:word2vec Parameter Learning Explained 发表时间:2016 发表作者:Xin Rong 论文链接:论文链接 为了揭开Word2vec的神秘面纱,不得不重新整理复习了Word2vec的相关资料. Xin Rong 的这篇英文paper是更多人首推的 Word2vec 参考资料.这篇论文理论完备,由浅入深,且直击要害,既有 高屋建瓴的 intuition 的解释,也有细节的推导过程.下面一起学习下这篇paper. 由于word2vec模型学习生成的词向量表示…
Inside-Outside Net (ION) 论文:Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks 发表时间:2016 发表作者:(Cornell University)Sean Bell, C. Lawrence Zitnick,(Microsoft Research)Kavita Bala, Ross Girshick 论文链接:论文链接 本文…
论文:HyperNet: Towards Accurate Region Proposal Generation and Joint Object Detection 发表时间:2016 发表作者:(tsinghua)Tao Kong, Anbang Yao, Yurong Chen, Fuchun Sun 发表刊物/会议:cvpr 论文链接:论文链接 CNN高层特征具有丰富的语义信息,低层特征具有较高空间分辨率,研究如何融合不同层之间的特征,是物体检测领域热门的方向.近期很多工作通过融合多层来…
在项目常常要和数据表格打交道. 现在BS的通常做法都是前端用一个js的Grid控件, 然后通过ajax的方式从后台加载数据, 然后将数据和Grid绑定. 数据往往不是一页可以显示完的, 所以要加分页:然后就是根据关键字段做排序, 做筛选过滤. 作为后端人员, 要考虑的是如何优雅的实现分页.排序.筛选的功能. 本文先谈谈筛选. 因为分页.排序.筛选这3个动作, 一定是先处理筛选的——筛选后的结果再去排序, 然后再做分页 , 才有意义. 筛选首先要考虑如下两个问题: 1) 字段类型 2) 比较方式…
背景:数据挖掘/机器学习中的术语较多,而且我的知识有限.之前一直疑惑正则这个概念.所以写了篇博文梳理下 摘要: 1.正则化(Regularization) 1.1 正则化的目的 1.2 正则化的L1范数(lasso),L2范数(ridge) 2.归一化 (Normalization)   2.1归一化的目的 2.1归一化计算方法 2.2.spark ml中的归一化 2.3 python中skelearn中的归一化 知识总结: 1.正则化(Regularization) 1.1 正则化的目的:我的…
上一篇<使用Expression实现数据的任意字段过滤(1)>, 我们实现了通过CriteriaCollectionHandler对象来处理集合数据过滤.通过适当的扩展, 应该可以满足一般的筛选条件应用了.但是在我经历的项目中, 突然有个情况让我措手不及.下面和大家分享下. 这个项目叫WebAD,顾名思义, 就是将AD的管理界面使用Web来实现. 无可避免的要查询AD里面的对象,比如UserPrinciple,即查找某一OU节点下的所有用户. 先感受下UserPrinciple的属性 再感受下…
SpEL简介与功能特性 Spring表达式语言(简称SpEL)是一个支持查询并在运行时操纵一个对象图的功能强大的表达式语言.SpEL语言的语法类似于统一EL,但提供了更多的功能,最主要的是显式方法调用和基本字符串模板函数. 同很多可用的Java 表达式语言相比,例如OGNL,MVEL和JBoss EL,SpEL的诞生是为了给Spring社区提供一个可以给Spring目录中所有产品提供单一良好支持的表达式语言.其语言特性由Spring目录中的项目需求驱动,包括基于eclipse的SpringSou…
CVPR 2016 Visual Tracking Paper Review  本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072659    http://blog.csdn.net/ben_ben_niao/article/details/52078727 做了一段时间的跟踪,最近CVPR大会也过了一段时间了,这次将CVPR2016跟踪的文章做一次总结,主要是对paper的方法,创新,改进等方面进行介绍和总结.具体的实现细…
这是行人检测相关资源的第二部分:源码和数据集.考虑到实际应用的实时性要求,源码主要是C/C++的.源码和数据集的网址,经过测试都可访问,并注明了这些网址最后更新的日期,供学习和研究进行参考.(欢迎补充更多的资源) 1        Source Code 1.1    INRIA Object Detection and Localization Toolkit http://pascal.inrialpes.fr/soft/olt/ Dalal于2005年提出了基于HOG特征的行人检测方法,行…
很多时候我们需要对IE6的bug写一些hack,如max-height,absolute元素高度100%等. css里面的 expression(表达式)和js里面的差不多,如: 获取当前元素的高度: .box{ height:expression(this.offsetHeight); } 我们也可以获取到本身高度后再加减某个高度: .box{ height:expression(this.offsetHeight-30); } 获取滚动的高度: top:expression(eval(doc…
0 - 背景 人体姿态识别存在遮挡以及关键点不清晰等主要挑战,然而,人体的关键点之间由于人体结构而具有相互关系,利用容易识别的关键点来指导难以识别关键点的检测,是提高关键点检测的一个思路.本文通过提出序列化结构模型,来提高人体姿态识别任务的效果. 1 - 贡献 使用一个序列卷积结构模型学习表达空间信息 采用系统的方法来设计和训练模型,以学习图像特征和依赖图像空间模型进行结构化预测的任务 在MPII/LSP/FLIC等数据集上实现了最好的性能 分析了联合训练一个多阶段.中间重复监督的架构的效果 2…
0 - 背景 人体姿态识别是计算机视觉的基础的具有挑战性的任务,其中对于身体部位的尺度变化性是存在的一个显著挑战.虽然金字塔方法广泛应用于解决此类问题,但该方法还是没有很好的被探索,我们设计了一个Pyramid Residual Module(PRMs)来提高DCNNs的尺度不变性. 并且我们发现现存的初始化方法并不适用multi-branch的网络,我们在当前的权重初始化方法上提出了新的方法并给出了理论证明. 1 - 贡献 提出Pyramid Residual Module来提高深度模型的尺度…
目录 1. 问题 2. 方法 3. 实验设计 3.1. 解决词典内部(一组已知)任务的能力 3.2. 解决新任务(少量标记数据)的能力 4. 讨论和启发 论文:Taskonomy: Disentangling Task Transfer Learning Zamir, Amir R., et al. "Taskonomy: Disentangling task transfer learning." Proceedings of the IEEE Conference on Compu…
0 - ABSTRACT 许多计算机任务在缺少上下文信息的情况下的处理会更加困难.例如,在多相机跟踪任务下,行人可能在不同照相机下面因为有这不同的姿势和灯光条件而看起来很不一样.类似地,在低分辨率高角度监控视频中,头部方向评估也是一个挑战.如果没有上下文信息,人们在处理此类任务时会有很大麻烦.在我们的工作中,我们将上下文信息.社会群体信息和两个重要的计算机视觉任务:多目标跟踪和监控视频的头部姿态和方向评估进行结合.这三部分都采用一个概率公式进行建模并且我们提出了有效的解决方案.在多相机跟踪和头部…
深度剖析 | 可微分学习的自适配归一化 (Switchable Normalization) 作者:罗平.任家敏.彭章琳 编写:吴凌云.张瑞茂.邵文琪.王新江 转自:知乎.原论文参考arXiv:1806.10779和代码Github. 导读:归一化技术已经成为深度学习系统必不可少的重要组成部分,对优化神经网络的参数.提高泛化性能有着重要作用.这些归一化方法包括但不限于批归一化BN(Batch Normalization),实例归一化IN(Instance Normalization),和层归一化…
Inception V2网络中的代表是加入了BN(Batch Normalization)层,并且使用 2个 3*3卷积替代 1个5*5卷积的改进版,如下图所示: 其特点如下: 学习VGG用2个 3*3卷积代替 Inception V1中的 5*5大卷积.这样做在减少参数(3*3*2+2 –> 5*5+1)的同时可以建立更多的非线性变换,增强网络对特征的学习能力.如下图所示,2个 3*3卷积的效果与一个 5*5 卷积的效果类似: 在 Inception V1中加入BN层,以减少 Internal…
目录 1. ABSTRACT 2. INTRODUCTION 3. RELATED WORKS 3.1. Quality Enhancement 3.2. Multi-frame Super-resolution 3. 压缩视频的质量波动 4. MF-CNN 4.1. Framework 4.2. SVM-based PQF detector 4.3. MC-subnet Architecture Training strategy 4.4. QE-subnet Architecture Tra…
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/8858998.html 论文: Ring loss: Convex Feature Normalization for Face Recognition https://arxiv.org/abs/1803.00130v1 理解的不对的地方请见谅 Ring loss将特征限制到缩放后的单位圆上,同时能保持凸性,来得到更稳健的特征. 该损失函数作为辅助的损失,结合Softmax或者A-softmax等损…
1 概念   归一化:1)把数据变成(0,1)或者(1,1)之间的小数.主要是为了数据处理方便提出来的,把数据映射到0-1范围之内处理,更加便捷快速.2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权.归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量.   标准化:在机器学习中,我们可能要处理不同种类的资料,例如,音讯和图片上的像素值,这些资料可能是高维度的,资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料…
概述 在.NET Framework 3.5中提供了LINQ 支持后,LINQ就以其强大而优雅的编程方式赢得了开发人员的喜爱,而各种LINQ Provider更是满天飞,如LINQ to NHibernate.LINQ to Google等,大有“一切皆LINQ”的趋势.LINQ本身也提供了很好的扩展性,使得我们可以轻松的编写属于自己的LINQ Provider. 本文为打造自己的LINQ Provider系列文章第一篇,主要介绍表达式目录树(Expression Tree)的相关知识. 认识表…
一.weight decay(权值衰减)的使用既不是为了提高你所说的收敛精确度也不是为了提高收敛速度,其最终目的是防止过拟合.在损失函数中,weight decay是放在正则项(regularization)前面的一个系数,正则项一般指示模型的复杂度,所以weight decay的作用是调节模型复杂度对损失函数的影响,若weight decay很大,则复杂的模型损失函数的值也就大.二.momentum是梯度下降法中一种常用的加速技术.对于一般的SGD,其表达式为,沿负梯度方向下降.而带momen…
Dropout是过去几年非常流行的正则化技术,可有效防止过拟合的发生.但从深度学习的发展趋势看,Batch Normalizaton(简称BN)正在逐步取代Dropout技术,特别是在卷积层.本文将首先引入Dropout的原理和实现,然后观察现代深度模型Dropout的使用情况,并与BN进行实验比对,从原理和实测上来说明Dropout已是过去式,大家应尽可能使用BN技术. 一.Dropout原理 根据wikipedia定义,dropout是指在神经网络中丢弃掉一些隐藏或可见单元.通常来说,是在神…
一:BN的解释:  定义: 顾名思义,batch normalization嘛,就是“批规范化”咯.Google在ICML文中描述的非常清晰,即在每次SGD时,通过mini-batch来对相应的activation做规范化操作,使得结果(输出信号各个维度)的均值为0,方差为1. 最后通过加入beta和gamma来还原数据的最初分布(通过这两个参数还原输出到输入的分布),则是为了让因训练所需而“刻意”加入的BN能够有可能还原最初的输入,使得在反向传播的时候,梯度能传播的更加明显,扩大网络的容量(对…
Coursera吴恩达<优化深度神经网络>课程笔记(3)-- 超参数调试.Batch正则化和编程框架 1. Tuning Process 深度神经网络需要调试的超参数(Hyperparameters)较多,包括: :学习因子 :动量梯度下降因子 :Adam算法参数 #layers:神经网络层数 #hidden units:各隐藏层神经元个数 learning rate decay:学习因子下降参数 mini-batch size:批量训练样本包含的样本个数 超参数之间也有重要性差异. 1.通常…
概述 在.NET Framework 3.5中提供了LINQ 支持后,LINQ就以其强大而优雅的编程方式赢得了开发人员的喜爱,而各种LINQ Provider更是满天飞,如LINQ to NHibernate.LINQ to Google等,大有“一切皆LINQ”的趋势.LINQ本身也提供了很好的扩展性,使得我们可以轻松的编写属于自己的LINQ Provider. 本文为打造自己的LINQ Provider系列文章第一篇,主要介绍表达式目录树(Expression Tree)的相关知识. 认识表…