1分钟理解人体姿态估计与行为识别
姿态估计与行为识别的区别
姿态估计是对图像或视频中的人提取关节和肢干,目的是排除其他因素的影响(如人物背景,不同颜色的衣服……)。总结起来就是重建关节、肢干,对图像降维。
行为识别的输入是姿态估计的输出,行为识别的输出就是预测人的行为,如跑步、走路、跳……。
方案一:(简单版本)
1. 对图片中的人物进行姿态估计,识别出头、肘、腕……的位置;
2. 将步骤1的输出格式化成需要的格式;
3. 预测步骤2的输出;
方案二:(复杂版本)
1. 根据单目、多目视觉,结合姿态估计,制作带时间序列的3D数据,相比方案一,该数据从平面上升到立体,从某一时刻变成带有时间序列的数据;
2. 之后步骤与方案一相同;