摘要:
读Poppe, R. (2010). "A survey on vision-based human action recognition." Image and Vision Computing 28(6): 976-990. 这篇文章写的是关于人体动作识别的综述类文章,论文中没有对某个具体的模型或算法做详细的描述,只是将其分类到作者框架下动作识别的一个研究方向。 在本篇论文的参考文献中,作者也列出了比较出名的此类综述性文章,但是每篇综述性文章的写作线索都不尽相同,这是因为每个学长对human action recognition的理解不完全相同。 本领域的一些难点和特点 阅读全文
摘要:
读Isard, M. and A. Blake (1998). "Condensation—conditional density propagation for visual tracking." International journal of computer vision 29(1): 5-28. 在目标跟踪领域中,kalman跟踪有着先天的不足,因为它是基于单模高斯分布的,不能同时表示多目标。而condensation算法使用了重采样技术,目标的概率分布通过随机产生的数据集来表示,然后使用已知的动态模型和观察模型来传播这些随机数据集。实验最后显示这个算法对快速运动 阅读全文
摘要:
读Comaniciu, D. and P. Meer (2002). "Mean shift: A robust approach toward feature space analysis." Pattern Analysis and Machine Intelligence, IEEE Transactions on 24(5): 603-619. 本文分析的算法mean shift是属于一种非参数算法,可以被用来分析复杂的多模态特征空间以及视觉领域的一些其它难题。 文章明确给出了mean shift的定义和计算方法。先将非参数密度估计用核函数表示,然后对其求导,通过引 阅读全文
摘要:
读Stauffer, C. and W. E. L. Grimson (1999). Adaptive background mixture models for real-time tracking, IEEE. 这篇文章首次将GMM模型引入cv领域中,提供了一个用背景减图法进行于前景检测的背景建模方法。文章中将每一个像素点都建立一个混合高斯模型(即用多个高斯来描述该像素点),并且能够在线近似更新该点的模型。训练阶段,当建立了多个高斯时,这些混合高斯的分布将会被评估决定哪些高斯最有可能代表背景模型。在检测阶段,将会计算每个像素点的值与混合高斯中高斯的相似度,如果到达预定阈值,则认为属于背景. 阅读全文
摘要:
帧差法是背景减图法中的一种,只不过是帧差法不需要建模,因为它的背景模型就是上一帧的图,所以速度非常快,另外帧差法对缓慢变换的光照不是很敏感,所以其用途还是有的,有不少学者对其做出了出色的改进。 其基本原理可以用下面公式看出: |i(t)-i(t-1)|<T 背景 |i(t)-i(t-1)|>=T 前景 其中i(t),i(t-1)分别为t,t-1时刻对应像素点的像素值,T为阈值。 当然其缺点也不少,容易出现”双影”和”空洞”现象。 用opencv2.3.1+vs2010做了个简单的实验,其实验代码如下: 1 // frame_diff.cpp : 定义控制台应用程序的入口点。 2.. 阅读全文