Mediapipe Hand笔记
《MediaPipe: A Framework for Building Perception Pipelines》
ML pipeline
所谓pipeline就是把一件事分为多个工序,有的工序可以并行执行,提升效率。
《MediaPipe Hands: On-device Real-time Hand Tracking》
检测步骤
分为两个步骤(2阶段):
- 1先检测手掌
使用的是野外数据集训练的 - 2根据手掌图绘制手部关键点
返回结果
返回结果:
1.21 hand landmarks consisting of x, y, and relative depth.
21个手部关键点,包含x,y,depth(离摄像头的距离)
2. A hand flag indicating the probability of hand presence in the input image.
一个标志数代表图片中是否出现了手
3. A binary classification of handedness, e.g. left or right hand.
一个数字代表检测到的是左手还是右手
数据集
- 野外
6K - 室内
10K
包含有几乎所有的手势 - 合成的
关键点检测
- 基于回归
- 基于热力图(精度高、但比回归慢):高斯概率、期望
自顶向下:先找物体,再画点
自底向上:先找点,再聚类
关键点检测的任务只要人能看出来,能标出来,就有效。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现