[论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

简介

本文提出了一种网络结构，不是利用分类和回归loss加权求和，提出对数据集进行裁剪来提高准确率的方法，在很多数据集上取得了SOTA。

网络结构

从图可以看出，使用的是resnet50作为backbone，然后接6个全连接，fc1就是回归，fc181就是看成分类问题，-90到90共181个值作为分类来看。然后梯度回传的时候分配一个权重，原文代码里回归的权重是0.1，而分类的权重是2000，所以这个还是希望分类的loss来导向回归，因为最终我们要用的还是回归，而不是直接用分类的结果作为输出结果的。因为角度分布还是连续的而不是离散的。我们将其看成离散问题是因为我们采集的时候是离散采集的，而输出必须是连续的，这样才符合实际。

crop数据集

对数据集进行crop也是本文的一大贡献，文章探索了不同crop比例下对结果的影响，具体的影响可以看下图。

为什么要裁剪呢？因为背景对结果的影响很大，同样一张图片换用不同的背景，预测的结果是不一样的，为了解决这个问题，就需要找到一个最合适的裁剪比例，所以就引出了这个方法，通过测试不同的裁剪比例，找到一个合适的K，在测试集上的准确率最高。所以本文的工作其实也是很有启发的，就是通过改变裁剪的比例来增强数据集。我认为在这个启发下其实还可以通过更换背景来扩充数据集，所以我们最近在做的工作就是与这个相关的。

实验和结论

这张图表明在BIWI数据集下本文的方法SOTA了，但是对比的方法其实还是很少的，这是2019年5月的文章，理应多比较一些方法，所以其实说服力欠缺。

这个就是作者做了很多组K的实验确定的结果，结论就是0.5就是最好的K值。

posted @ 2019-07-15 01:02 aoru45 阅读(611) 评论(0) 收藏举报

刷新页面返回顶部

漂流，浪客

浪迹走天涯。

[论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

简介

网络结构

crop数据集

实验和结论

公告