Mediapipe Hand笔记

《MediaPipe: A Framework for Building Perception Pipelines》

ML pipeline
所谓pipeline就是把一件事分为多个工序,有的工序可以并行执行,提升效率。

《MediaPipe Hands: On-device Real-time Hand Tracking》

检测步骤

分为两个步骤(2阶段):

  • 1先检测手掌
    使用的是野外数据集训练的
  • 2根据手掌图绘制手部关键点

返回结果

返回结果:
1.21 hand landmarks consisting of x, y, and relative depth.
21个手部关键点,包含x,y,depth(离摄像头的距离)
2. A hand flag indicating the probability of hand presence in the input image.
一个标志数代表图片中是否出现了手
3. A binary classification of handedness, e.g. left or right hand.
一个数字代表检测到的是左手还是右手

数据集

  • 野外
    6K
  • 室内
    10K
    包含有几乎所有的手势
  • 合成的

关键点检测

  • 基于回归
  • 基于热力图(精度高、但比回归慢):高斯概率、期望

自顶向下:先找物体,再画点
自底向上:先找点,再聚类
关键点检测的任务只要人能看出来,能标出来,就有效。

posted @ 2024-07-09 12:59  猪猪猪猪侠  阅读(6)  评论(0编辑  收藏  举报