现阶段的目标跟踪算法能够在简单的场景中进行鲁棒的实时跟踪。但是通常需要一些约束条件,如运动的平滑性,遮挡的数目,光照不变条件,目标与背景之间的对比度等。实际的应用场景很难符合这些条件。所以,特征选择、目标表达、运动形状、运动估计等相关问题还是较为热门的研究领域。
在不受限制的日常视频中跟踪目标也是个重大挑战。噪声、压缩、非结构化场景都是带来困难的因素。
利用特定的环境信息也是一个重要的研究方向。比如车辆跟踪中汽车应该限制在路面上而不是天上或墙上。这方面的信息对识别非常有意义。
特征集合的选择对跟踪效果的影响也很大,通常选择区分性较好的特征。
现在流行使用多种特征的加权组合。机器学习和模式识别对特征选择做了很多研究,但都需要离线的特征学习过程。而跟踪问题需要在线的特征选择。[Collins and Liu 2003; Stern and Efros 2002]对这个问题有一定研究,但是仍需深入。在线的Boosting[Oza 2002]可能是个较为合适的解决方案。
目标表达模型的选择也是一个重要内容。现阶段大部分算法采用的是预定义的模型;而在线的模型学习能够提高跟踪性能。
基于运动的分割[Vidal andMa 2004; Black and Anandan 1996;Wang and Adelson 1994]和多目标的因式分解方法[Costeira and Kanade 1998; Gear 1998]被用来学习多目标在场景中的移动的模型。但是这些方法假设了目标刚性运动。非刚性多目标运动下目标模型的无监督学习仍然不好解决。
半监督学习建模可能能够提供较好的解决方案。包括Cotrainging [Levin et al. 2003; Blum and Mitchell 1998], transductive SVMs [Joachims 1999], constrained graph cuts [Yu and Shi 2004];这些方法不需要大量的训练数据,能够学习非刚性目标形状和外观,还可能以negative training数据的形式将背景信息计算在内。
概率状态空间方法,包括卡尔曼滤波,JPDAF,HMM,动态贝叶斯网络等,用来估计目标运动的参数。其中动态贝叶斯网络是表达多变量或图像观测之间条件依赖性最通用的方法。也提供了从不同信息源中进行信息融合的标准框架。但是这些算法的精度还需要进一步提高。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/lynphoenix/archive/2011/02/18/6192592.aspx