DensePose: Dense Human Pose Estimation In The Wild（理解）

0 - 背景

　　Facebook AI Research（FAIR）开源了一项将2D的RGB图像的所有人体像素实时映射到3D模型的技术（DensePose）。支持户外和穿着宽松衣服的对象识别，支持多人同时识别，并且实时性良好。

　　本研究的目的是通过建立从人体的2D图像到基于表面的3D表征的密集对应（dense correspondence）来进一步推进机器对图像的理解。该任务涉及到其他一些问题，如物体检测、姿态估计、作为特例或前提的部位和实例分割。在图形处理、增强现实或者人机交互等不只需要平面关键特征位置标记的问题中，这一任务的解决将能够实现很多应用，并还能助力实现通用型的基于3D的物体理解。

1 - 贡献

通过收集SMPL模型和COCO数据集中的人体外观之间的密对应对应而为该任务引入第一个人工收集的真实数据集（利用3D表面信息的全新标注流程实现）
通过在任何图像像素对人体表面坐标进行回归，我们使用所得到的数据集训练了可以得到自然环境中密集对应的基于CNN的系统（全卷积网络、mask R-CNN、级联）
我们探索了利用我们构建的真实信息的不同方法，我们使用了在每个训练样本中随机选择的图像像素子集上定义的稀疏监督信号来训练一个教师网络（“teacher”），可以修补图像其余区域的监督信号