Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

简介

本文提出了一种网络结构,不是利用分类和回归loss加权求和,提出对数据集进行裁剪来提高准确率的方法,在很多数据集上取得了SOTA。

网络结构

从图可以看出,使用的是resnet50作为backbone,然后接6个全连接,fc1就是回归,fc181就是看成分类问题,-90到90共181个值作为分类来看。然后梯度回传的时候分配一个权重,原文代码里回归的权重是0.1,而分类的权重是2000,所以这个还是希望分类的loss来导向回归,因为最终我们要用的还是回归,而不是直接用分类的结果作为输出结果的。因为角度分布还是连续的而不是离散的。我们将其看成离散问题是因为我们采集的时候是离散采集的,而输出必须是连续的,这样才符合实际。

crop数据集

对数据集进行crop也是本文的一大贡献,文章探索了不同crop比例下对结果的影响,具体的影响可以看下图。

为什么要裁剪呢?因为背景对结果的影响很大,同样一张图片换用不同的背景,预测的结果是不一样的,为了解决这个问题,就需要找到一个最合适的裁剪比例,所以就引出了这个方法,通过测试不同的裁剪比例,找到一个合适的K,在测试集上的准确率最高。所以本文的工作其实也是很有启发的,就是通过改变裁剪的比例来增强数据集。我认为在这个启发下其实还可以通过更换背景来扩充数据集,所以我们最近在做的工作就是与这个相关的。

实验和结论

这张图表明在BIWI数据集下本文的方法SOTA了,但是对比的方法其实还是很少的,这是2019年5月的文章,理应多比较一些方法,所以其实说服力欠缺。

这个就是作者做了很多组K的实验确定的结果,结论就是0.5就是最好的K值。

[论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment的更多相关文章

  1. [论文笔记] Fine-Grained Head Pose Estimation Without Keypoints

    Fine-Grained Head Pose Estimation Without Keypoints 简介 head pose estimation 经典论文,使用CNN预测三个角度值,pitch, ...

  2. 论文阅读笔记四十七:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression(CVPR2019)

    论文原址:https://arxiv.org/pdf/1902.09630.pdf github:https://github.com/generalized-iou 摘要 在目标检测的评测体系中,I ...

  3. 论文笔记 Robust face landmark estimation under occlusion

    1. Abstract 现实世界中的人脸很多时候都存在遮挡以及大的形状变化,而目前的人脸关键点检测方法在这种情况下表现欠佳, 因为它们未能提供一种系统的方法来处理异常.因而authors提出一种新的方 ...

  4. 论文笔记: Mutual Learning to Adapt for Joint Human Parsing and Pose Estimation

    Mutual Learning to Adapt for Joint Human Parsing and Pose Estimation 2018-11-03 09:58:58 Paper: http ...

  5. 论文笔记 Stacked Hourglass Networks for Human Pose Estimation

     Stacked Hourglass Networks for Human Pose Estimation key words:人体姿态估计 Human Pose Estimation 给定单张RGB ...

  6. Towards Accurate Multi-person Pose Estimation in the Wild 论文阅读

    论文概况 论文名:Towards Accurate Multi-person Pose Estimation in the Wild 作者(第一作者)及单位:George Papandreou, 谷歌 ...

  7. 论文解读:3D Hand Shape and Pose Estimation from a Singl RGB Image

    本文链接:https://blog.csdn.net/williamyi96/article/details/89207640由于最近做到了一些 3D Hand Pose Estimation 相关的 ...

  8. Spectral Norm Regularization for Improving the Generalizability of Deep Learning论文笔记

    Spectral Norm Regularization for Improving the Generalizability of Deep Learning论文笔记 2018年12月03日 00: ...

  9. 论文阅读理解 - Stacked Hourglass Networks for Human Pose Estimation

    http://blog.csdn.net/zziahgf/article/details/72732220 keywords 人体姿态估计 Human Pose Estimation 给定单张RGB图 ...

随机推荐

  1. 如何使用Resource资源文件

    一.目的 为了能够在DisplayAttribute中重复使用同样的名称,将所有的显示字符串集中管理. 二.方法 1.DisplayAttribute本身支持直接使用资源文件. [Display(Re ...

  2. MySQL数据库入门备份数据库

    MySQL数据库入门——备份数据库   一提到数据,大家神经都会很紧张,数据的类型有很多种,但是总归一点,数据很重要,非常重要,因此,日常的数据备份工作就成了运维工作的重点中的重点的重点....... ...

  3. H5头部meta标签的作用

    <!DOCTYPE html>  H5标准声明,使用 HTML5 doctype,不区分大小写 <head lang=”en”> 标准的 lang 属性写法 <meta ...

  4. inux下:热插拔和模块是什么

    一.何为模块? 文件系统.设备驱动程序.网络协议都可以理解为模块.模块本质也是普通的软件系统. 二.热插拔 硬件层面:只在不断电.不关闭系统的情况下增加或者删除对应部件,比如电源.硬盘.一些高端设备硬 ...

  5. laravel-admin Field type [editor] does not exist.

    把App/admin中的bootstrap.php 里边的Encore\Admin\Form::forget(['map', 'editor']);注释掉就行了 解决网址:http://tieba.b ...

  6. 一、json数组的键和值

    一.json数组的键和值 https://blog.csdn.net/sinat_30224769/article/details/51702203 string test_json = " ...

  7. js实现倒计时(分:秒)

    上代码: //倒计时start 需要传入的参数为秒数,此方法倒计时结束后会自动刷新页面 function resetTime(timetamp){ var timer=null; var t=time ...

  8. neutron网络服务部署

    控制节点执行 #第一步 登陆数据库 mysql -u root -p #导入neutron这个库 CREATE DATABASE neutron; #创建neutron这个用户和密码,并允许本地登陆和 ...

  9. 在Scrapy里设置Cookies 要注意一点!

    1.requests里设置cookies,可以将cookies放入headers里一同提交. {'Accept': 'text/html,application/xhtml+xml,applicati ...

  10. Window10的激活步骤

    1. 首先,我们先查看一下Win10正式专业版系统的激活状态: 点击桌面左下角的“Windows”按钮,从打开的扩展面板中依次点击“设置”-“更新和安全”,并切换到“激活”选项卡,在此就可以查看到当前 ...