前言: 论文及源代码网址: https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation 地址2: https://github.com/CMU-Perceptual-Computing-Lab/openpose/blob/master/doc/installation.md 1.  一个失败的尝试 首先是跑一个例子试试,使用 https://github.com/CMU-Perceptual-Computing-Lab/openpo…
从DeepNet到HRNet,这有一份深度学习"人体姿势估计"全指南 几十年来,人体姿态估计(Human Pose estimation)在计算机视觉界备受关注.它是理解图像和视频中人物行为的关键一步. 在近年深度学习兴起后,人体姿态估计领域也发生了翻天覆地的变化. 今天,文摘菌就从深度学习+二维人体姿态估计的开山之作DeepPose开始讲起,为大家盘点近几年这一领域的最重要的论文. 什么是人体姿势估计? 人体姿态估计(Human Pose Estimation,以下简称为HPE)被定…
人体姿态和形状估计的视频推理:CVPR2020论文解析 VIBE: Video Inference for Human Body Pose and Shape Estimation 论文链接:https://arxiv.org/pdf/1912.05656.pdf Code and pretrained models are available at: https://github.com/mkocabas/VIBE 摘要 人体运动是理解行为的基础.尽管在单图像三维位姿和形状估计方面取得了进展,…
快速人体姿态估计:CVPR2019论文阅读 Fast Human Pose Estimation 论文链接: http://openaccess.thecvf.com/content_CVPR_2019/papers/Zhang_Fast_Human_Pose_Estimation_CVPR_2019_paper.pdf 摘要 现有的人体姿态估计方法通常只考虑如何提高模型的泛化性能,而忽略了显著的效率问题.这导致在实际应用中开发可扩展性和成本效益较差的重型模型.在这项工作中,我们研究了研究不足但…
http://blog.csdn.net/myarrow/article/details/51933651 1. 目前进展 1.1 相关资料      1)HANDS CVPR 2016      2)HANDS 2015 Dataset      3)CVPR 2016      4)Hand 3D Pose Estimation (Computer Vision for Augmented Reality Lab)          5)CVPR2016 Tutorial: 3D Deep…
背景 AB实验可谓是互联网公司进行产品迭代增加用户粘性的大杀器.但人们对AB实验的应用往往只停留在开实验算P值,然后let it go...let it go ... 让我们把AB实验的结果简单的拆解成两个方面: \[P(实验结果显著) = P(统计检验显著|实验有效)× P(实验有效)\] 如果你的产品改进方案本来就没啥效果当然怎么开实验都没用,但如果方案有效,请不要让 statictical Hack 浪费一个优秀的idea 如果预期实验效果比较小,有哪些基础操作来增加实验显著性呢? 通常情…
背景 都说随机是AB实验的核心,为什么随机这么重要呢?有人说因为随机所以AB组整体不存在差异,这样才能准确估计实验效果(ATE) \[ ATE = E(Y_t(1) - Y_c(0)) \] 那究竟随机是如何定义的呢? 根据Rubin Causal Model, 想要让上述估计无偏,随机实验需要满足以下两个条件: SUTVA 实验个体间不相互影响 实验个体间的treatment可比 Ignorability(Unconfoundness是更强的假设) 是否受到实验干预和实验结果无关,从因果图的角…
这篇是treatment effect估计相关的论文系列第一篇所以会啰嗦一点多给出点背景. 论文 Athey, S., and Imbens, G. 2016. Recursive partitioning for heterogeneous causal effects. Proceedings of the National Academy of Sciences. 背景 论文给出基于决策树估计实验对不同用户的不同影响.并提出Honest,variance Penalty算法旨在改进CART…
3D深度估计 Consistent Video Depth Estimation 论文地址:https://arxiv.org/pdf/2004.15021.pdf 项目网站:https://roxanneluo.github.io/Consistent-Video-Depth-Estimation/ 这项研究主要探究了如何生成准确度和几何一致性更高的视频重建结果,目前该论文已被计算机图形学顶级会议 SIGGRAPH 2020 接收,代码也将在未来开源. 摘要 提出了一种重建单眼视频中所有像素的…
本文先对FCN的会议论文进行了粗略的翻译,使读者能够对论文的结构有个大概的了解(包括解决的问题是什么,提出了哪些方案,得到了什么结果).然后,给出了几篇博文的连接,对文中未铺开解释的或不易理解的内容作了详尽的说明.最后给出了FCN代码的详解(待更新). Fully Convolutional Networks for Semantic Segmentation 用于语义分割的全卷积网络 摘要 卷积网络是可以产生具有层次结构的特征的强大的视觉模型.我们展示了只通过由端到端,像素像素训练的卷积网络进…
<Macro-Micro Adversarial Network for Human Parsing> 摘要:在人体语义分割中,像素级别的分类损失在其低级局部不一致性和高级语义不一致性方面存在缺陷.对抗性网络的引入使用单个鉴别器来解决这两个问题.然而,两种类型的解析不一致是由不同的机制产生的,因此单个鉴别器很难解决它们.为解决这两种不一致问题,本文提出了宏观 - 微观对抗网络(MMAN).它有两个鉴别器,一个鉴别器Macro D作用于低分辨率标签图并且惩罚语义不一致性,例如错位的身体部位.另一…
1. 前言 多任务学习(Multi-task learning)是和单任务学习(single-task learning)相对的一种机器学习方法.在机器学习领域,标准的算法理论是一次学习一个任务,也就是系统的输出为实数的情况.复杂的学习问题先被分解成理论上独立的子问题,然后分别对每个子问题进行学习,最后通过对子问题学习结果的组合建立复杂问题的数学模型.多任务学习是一种联合学习,多个任务并行学习,结果相互影响. 拿大家经常使用的school data做个简单的对比,school data是用来预测…
转自:http://www.csdn.net/article/2015-03-19/2824267 上周,我去洛杉矶参加了一个机器学习的meetup,一位主讲是eHarmony公司(美国最大的婚恋交友网站之一,通过性格测试来进行婚恋匹配的模式——百度百科)的Jon Morra,他着重分享了机器学习(machine learning)在他们的在线交友平台中的应用.机器学习技术应用的深度和广度给我留下了深刻的印象,他们居然能够应用到大多数人都能遇到的问题——寻找爱情上! 这是演讲视频的下载. 核心问…
译自:http://sebastianruder.com/multi-task/ 1. 前言 在机器学习中,我们通常关心优化某一特定指标,不管这个指标是一个标准值,还是企业KPI.为了达到这个目标,我们训练单一模型或多个模型集合来完成指定得任务.然后,我们通过精细调参,来改进模型直至性能不再提升.尽管这样做可以针对一个任务得到一个可接受得性能,但是我们可能忽略了一些信息,这些信息有助于在我们关心的指标上做得更好.具体来说,这些信息就是相关任务的监督数据.通过在相关任务间共享表示信息,我们的模型在…
CNN综述文章 的翻译 [2019 CVPR] A Survey of the Recent Architectures of Deep Convolutional Neural Networks 翻译 综述深度卷积神经网络架构:从基本组件到结构创新 目录 摘要    1.引言    2.CNN基本组件        2.1 卷积层        2.2 池化层        2.3 激活函数        2.4 批次归一化        2.5 Dropout        2.6 全连接层…
A Robust and Modular Multi-Sensor Fusion ApproachApplied to MAV Navigation 众所周知,将来自多个传感器的信息融合用于机器人导航导致增加的鲁棒性和准确性.然而,在现场部署之前准确校准传感器集合以及传感器中断,不同的测量速率和延迟,使得多传感器融合成为挑战.因此,为了简单起见,大多数系统都没有利用所有可用的传感器信息.例如,在需要将机器人从室内转移到室外的任务中,忽视全球定位系统(GPS)信号是常态,这些信号一旦在室外就可以免…
本文作者 任旭倩,公众号:计算机视觉life,编辑成员 欧洲 英国伦敦大学帝国理工学院 Dyson 机器人实验室 http://www.imperial.ac.uk/dyson-robotics-lab 简介: 伦敦帝国理工学院戴森机器人实验室成立于2014年,由Andrew Davison.教授领导.是戴森公司和帝国理工学院领导机器人视觉小组Andrew Davison教授的合作实验室,Andrew Davison是视觉SLAM领域的先驱,戴森提供大量的资金和支持,以建立一个机器人专家团队,他…
Conditional Random Fields as Recurrent Neural Networks ICCV2015    cite237 1摘要: 像素级标注的重要性(语义分割 图像理解)-- 现在开始利用DL----但DL无法描述visual objects----本文引入新型的CNN,将CNN与CRF概率图模型结合---用高斯pairwise势函数定义的CRF作为RNN,记为CRF-RNN----将其作为CNN的一部分,使得深度模型同时具有CNN和CRF的特性,同时本文算法完美结…
翻译 局部不变特征探测器:一项调查 摘要 -在本次调查中,我们概述了不变兴趣点探测器,它们如何随着时间的推移而发展,它们如何工作,以及它们各自的优点和缺点.我们首先定义理想局部特征检测器的属性.接下来是对过去四十年中根据不同类别的特征提取方法组织的文献的概述.然后,我们对选择的方法进行更详细的分析,这些方法对研究领域产生了特别重大的影响.最后总结并展望未来的研究方向. 1引言 在本节中,我们将讨论局部(不变)特征的本质.这个词我们的意思是什么?使用局部特征有什么好处?我们可以用它们做什么?理想的…
摘要: 对于人物识别技术来说,动作和人体测量统计学对于光学差异并不敏感,甚至对于眼镜,头发,帽子的描述相当粗糙,现在的以步态为基础的识别技术都是基于对细节的精确描述和对步态周期的精确测量.这种方法需要运动主角在简单背景下反复的重复一个单一动作,并且需要昂贵的动作捕捉系统或者二维的视频系统,以便研究人员可以对运动物体进行分段和跟踪.现有的设备限制了人体测量统计学在实际场景中的运用,因为实际场景中的动作存在不同程度的复杂性.我们发展了一种新的人物识别方法,这种方法以动作和人体测量统计学为基础,并且所…
9012年已经悄悄过去了1/3. 过去的100多天里,在深度学习领域,每天都有大量的新论文产生.所以深度学习研究在2019年开了怎样一个头呢? Open Data Science对第一季度的深度学习研究进行了盘点总结,推出了这一季度的十佳论文.一起来看看,TOP10都花落谁家吧. 基于PyTorch Geometric的快速图像表征学习 Fast Graph Representation Learning with PyTorch Geometric 这篇论文的作者Matthias Fey和Ja…
本节主要学习Keras的应用模块 Application提供的带有预训练权重的模型,这些模型可以用来进行预测,特征提取和 finetune,上一篇文章我们使用了VGG16进行特征提取和微调,下面尝试一下其他的模型. 模型的预训练权重将下载到 ~/.keras/models/ 并在载入模型时自动载入,当然我们也可以下载到自己的目录下,但是需要去源码修改路径. 模型的官方下载路径:https://github.com/fchollet/deep-learning-models/releases Te…
人脸标记检测:ICCV2019论文解析 Learning Robust Facial Landmark Detection via Hierarchical Structured Ensemble 论文链接: http://openaccess.thecvf.com/content_ICCV_2019/papers/Zou_Learning_Robust_Facial_Landmark_Detection_via_Hierarchical_Structured_Ensemble_ICCV_201…
ADAS虚拟车道边界生成 Virtual Lane Boundary Generation for Human-Compatible Autonomous Driving: A Tight Coupling between Perception and Planning 论文地址: http://faculty.cs.tamu.edu/dzsong/pdfs/Binbin_LDRGT_IROS2019_V19.pdf 摘要 现有的无人驾驶(AV)导航算法将车道识别,避障,局部路径规划和车道跟踪视…
​ 前言: 目标检测的预测框经过了滑动窗口.selective search.RPN.anchor based等一系列生成方法的发展,到18年开始,开始流行anchor free系列,CornerNet算不上第一篇anchor free的论文,但anchor freee的流行却是从CornerNet开始的,其中体现的一些思想仍值得学习. 看过公众号以往论文解读文章的读者应该能感觉到,以往论文解读中会有不少我自己的话来表述,文章写得也很简练.但这篇论文的写作实在很好,以至于这篇解读文章几乎就是对论…
介绍 OpenCV是开源计算机视觉和机器学习库.包含成千上万优化过的算法.项目地址:http://opencv.org/about.html.官方文档:http://docs.opencv.org/modules/core/doc/intro.html.OpenCV已支持OpenCL OpenGL,也支持iOS和Android.OpenCV的API是C++的,所以在iOS中最佳实践是将用到OpenCV功能写一层Objective-C++封装.这些封装把OpenCV的C++API转化为安全的Obj…
拟采用的方法,CamShift算法,即"Continuously Apative Mean-Shift"算法,是一种运动跟踪算法.它主要通过视频图像中运动物体的颜色信息来达到跟踪的目的.该算法的已经在PC上尝试过,效果良好.目前正在往手机上移植. 这个算法是根据颜色信息来跟踪吗?有待验证 (1)Camshift算法 转自: http://blog.sina.com.cn/s/blog_5d1476580101a57j.html Camshift算法是Continuously Adapt…
暑假听了computer vision的一个Summer School,里面Jason J. Corso讲了他们运用Low-Mid-High层次结构进行Video Understanding 和 Activity Recognition的方法,受益颇深,在这里把他的方法总结一下: ------------------------------------------------------------------------------------------------- 1. 层次结构表示:…
OpenCV是开源计算机视觉和机器学习库.包含成千上万优化过的算法.项目地址:http://opencv.org/about.html.官方文档:http://docs.opencv.org/modules/core/doc/intro.html.OpenCV已支持OpenCL OpenGL,也支持iOS和Android.OpenCV的API是C++的,所以在iOS中最佳实践是将用到OpenCV功能写一层Objective-C++封装.这些封装把OpenCV的C++API转化为安全的Object…
源地址:http://www.learnopencv.com/facial-landmark-detection/#comment-2471797375 OCTOBER 18, 2015 BY SATYA MALLICK 51 COMMENTS Facial landmark detection using Dlib (left) and CLM-framework (right). Who sees the human face correctly: the photographer, the…