Reading papers_5(与human activity analysis综述相关,ing...)

  1. Poppe, R. (2010). "A survey on vision-based human action recognition." Image and Vision Computing 28(6): 976-990.

  这篇文章写的是关于人体动作识别的综述类文章,论文中没有对某个具体的模型或算法做详细的描述,只是将其分类到作者框架下动作识别的一个研究方向。

  在本篇论文的参考文献中,作者也列出了比较出名的此类综述性文章,但是每篇综述性文章的写作线索都不尽相同,这是因为每个学长对human action recognition的理解不完全相同。

  本领域的一些难点和特点:1.人体动作的变种太多,同一种动作其变化有时候区分度很大,而不同动作的区分度有时候又不太不明显,所以随着动作类型的增多,其分类任务难度就增大了。2.环境变化太大,比如说背景杂乱,遮挡,光照,动态背景模型,运动摄像头等加大了动作识别的难度。3.动作的时间因素,如果视频的帧率不同,则相同动作持续的时间也不相同,增加了识别的难度。4.由于是视频数据,3维的,所以数据的获取和标注也相当困难。鉴于此,作者总结了一些常用的公开数据集。KTH,Weizmann,INRIA XMAS,UCF,Hollywood 等。

  人体行为识别步骤大致分为2个部分:特征的描述+分类器。

  特征的描述又分为全局描述,局部描述。

  全局描述需要通过人体检测和跟踪来定位人体,然后对其进行特征提取来描述。因此其依赖于定位的精度。Grid-based方法用于解决全局描述对噪声,部分遮挡,视角变化的敏感弱点。运动能量图MEI和运动历史图MHI都是基于人体剪影的。另外2个代表是全局grid-based描述以及STV时空体描述。

  局部描述是对人体单独patch进行提取的。首先是检测局部的特征点,然后通过某种方法连接起来作为整体的描述,比较成功的有bga-of-feature。局部描述的优点是对于光照,部分遮挡不是很敏感。其研究方向有时空兴趣点检测和描述,局部local-based描述,局部描述子之间的相关性。

  当然除了全局和局部描述2种外,作者还总结了针对具体应用的描述子。

  当目标特征被提取出来并且表示好之后,行为识别问题就变成了一个分类问题了。

  首先是分类器中的直接分类器,在分类前需要对特征维数进行削减,常用的算法有PCA,流行学习等。KNN,SVM等都属于直接分类器。

  其次就是时空状态模型,比如说DTW动态时间规整,HMM,CRF等。

  最后作者提出了未来行为识别的研究热点:1.特征点描述的应用能力,比如说解决遮挡问题等。2.分类器的灵活性设计。3.算法的实时性。4.行为识别算法的平均标准等。

 

 

 

 

posted on 2012-05-01 22:37  tornadomeet  阅读(1211)  评论(0编辑  收藏  举报

阿萨德发斯蒂芬