飞夺泸定桥

我心飞扬

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2011年6月9日

摘要: Ransac是用途很广泛的算法,详细介绍请看http://en.wikipedia.org/wiki/RANSAC。下面简单介绍一下(没兴趣的可以略过不看)。我们分析世界,需要对世界建模,把世界中的现象抽象成模型。每个模型,又存在一些参数,通过调节参数,可以得到不同的实例,进行推演。我们观察现象,得到一堆数据。如何为这堆数据找一个合适的模型,再确定合适的模型参数,这是很重要的问题,是人类理性的基础。数据分两种:有效数据(inliers)和无效数据(outliers)。那些偏差不大的数据是有效数据,偏差大的数据是无效数据。如果有效数据占大多数,无效数据只是很少量时,我们可以通过最小二乘法或类似的 阅读全文
posted @ 2011-06-09 21:52 飞夺泸定桥 阅读(22541) 评论(0) 推荐(7) 编辑

摘要: 图像傅立叶变换图像的傅立叶变换,原始图像由N行N列构成,N必须是基2的,把这个N*N个包含图像的点称为实部,另外还需要N*N个点称为虚部,因为FFT是基于复数的,如下图所示:计算图像傅立叶变换的过程很简单:首先对每一行做一维FFT,然后对每一列做一维FFT。具体来说,先对第0行的N个点做FFT(实部有值,虚部为0),将FFT输出的实部放回原来第0行的实部,FFT输出的虚部放回第0行的虚部,这样计算完全部行之后,图像的实部和虚部包含的是中间数据,然后用相同的办法进行列方向上的FFT变换,这样N*N的图像经过FFT得到一个N*N的频谱。下面展示了一副图像的二维FFT变换:频域中可以包含负值,图像中 阅读全文
posted @ 2011-06-09 20:52 飞夺泸定桥 阅读(2969) 评论(1) 推荐(1) 编辑

摘要: 傅里叶变换是将时域信号分解为不同 频率的正弦和/余弦和的形式。傅里叶变换是数字图像处理技术的基础,其通过在时空域和频率域来回切换图像,对图像的 信息特征进行提取和分析。一维傅里叶变换及其反变换单变量连续函数,f(x)的傅里叶变换F(u)定义为等式:u=0,1,2,…,M一1 同样,给出F(u), 能用反DFT来获得原函数: 其中,u=0,1,2,…,M一1。因此,我们看到傅里叶变换的每项[即对于每个u值,F(u)的值]由f(x)函数所有值的和组成。f(x)的值则与各种频率的正弦值和余弦值相乘。F(u)值的范围覆盖的域(u的值)称为频率域,因为u决定了变换的频率成分(x也作用于频率,但它们相加, 阅读全文
posted @ 2011-06-09 20:28 飞夺泸定桥 阅读(14110) 评论(1) 推荐(4) 编辑

摘要: 先说下什么是线性插值:简单比方,原来的数值序列:0,10,20,30,40 线性插值一次为:0,5,10,15,20,25,30,35,40 即认为其变化(增减)是线形的,可以在坐标图上画出一条直线 在数码相机技术中,这些数值可以代表组成一张照片的不同像素点的色彩、色度等指标。 为了方便理解,先考虑一维情况下的线性插值 对于一个数列c,我们假设c[a]到c[a+1]之间是线性变化的 那么对于浮点数x(a<=x<a+1),c(x)=c[a]+(x-a)*(c[a+1]-c[a])=c[a+1]*(x-a)+c[a]*(1+a-x); 把这种插值方式扩展到二维情况 对于一个二维数组c, 阅读全文
posted @ 2011-06-09 01:55 飞夺泸定桥 阅读(487) 评论(0) 推荐(0) 编辑

摘要: 1:彩色图像转灰度,加权平均法W=0.229×R+0 587xG+0114xB(1)缩小图像为源图像的1/42: 中值滤波: 是否需要 ,看效果吧3:二值化 : 大律法阈值4:边缘提取:可以使用简单的一阶差分运算,在水平方向和垂直方向,或者带有滤波效果的soble算子5:车牌粗提取:在水平方向上边缘统计发获得车牌大概位置的2个,在边缘统计图里面,从下向上进行判断,获得2个峰值,然后寻找 在获得的水平区域,利用垂直边缘统计获得车牌的具体位置 问题是:是否有其他区域的干扰?6:精确定位:(1)车牌的高宽比例,这个只有在正面的时候才成立,并不是非常确定的条件 (2)对粗定位中提取的区域进行 阅读全文
posted @ 2011-06-09 01:51 飞夺泸定桥 阅读(596) 评论(0) 推荐(0) 编辑

摘要: 核跟踪 核跟踪的目标表达通常用原始的目标区域来表达,跟踪由计算目标运动来实现的。目标运动以参数形式的运动(如平移、仿射等)或计算得到的连续帧的密度流区域描述。这些算法在外观表达的运动、跟踪的目标数目、运动估计使用的方法等方面有所差异。核跟踪算法可分为两类:分别是基于模板和概率密度的外观模型的跟踪,和基于多视角外观模型跟踪。1 基于模板和概率密度外观模型的跟踪 这类方法计算简单,方法直观。根据目标是独立跟踪还是联合跟踪又可分为两个子类。1.1 单目标跟踪这类算法中最常用的是模板匹配,也是最直观的方法。在图像中搜索类似于预定义模板的区域,通过相似性度量(比如cross correlation)判断 阅读全文
posted @ 2011-06-09 01:44 飞夺泸定桥 阅读(1468) 评论(0) 推荐(0) 编辑

摘要: 现阶段的目标跟踪算法能够在简单的场景中进行鲁棒的实时跟踪。但是通常需要一些约束条件,如运动的平滑性,遮挡的数目,光照不变条件,目标与背景之间的对比度等。实际的应用场景很难符合这些条件。所以,特征选择、目标表达、运动形状、运动估计等相关问题还是较为热门的研究领域。在不受限制的日常视频中跟踪目标也是个重大挑战。噪声、压缩、非结构化场景都是带来困难的因素。利用特定的环境信息也是一个重要的研究方向。比如车辆跟踪中汽车应该限制在路面上而不是天上或墙上。这方面的信息对识别非常有意义。特征集合的选择对跟踪效果的影响也很大,通常选择区分性较好的特征。 现在流行使用多种特征的加权组合。机器学习和模式识别对特征选 阅读全文
posted @ 2011-06-09 01:42 飞夺泸定桥 阅读(759) 评论(0) 推荐(0) 编辑

摘要: 1 遮挡问题 细了说,遮挡分为三种情况:自遮挡,目标间遮挡, 背景遮挡。通常对于目标间的遮挡,多目标跟踪算法(如MacCormick and Blake [2000] and Elgammal et al. [2002])可以根据目标的位置和外观的先验知识解决这一问题。而场景结构的部分遮挡则难以判断,因为难以辨认究竟是目标性状变化还是发生遮挡。处理遮挡的通用方法是用线性或非线性动态模型建模目标运动,并在发生遮挡的时候继续预测目标位置,直到目标重新出现再修正它。 Beymer and Konolige [1999]用了线性速度模型,并运用了卡尔曼滤波器来估计目标的位置和运动 Isard and 阅读全文
posted @ 2011-06-09 01:40 飞夺泸定桥 阅读(663) 评论(0) 推荐(1) 编辑

摘要: 目标检测:或者在每帧中都进行检测,或者在目标出现时检测。有利用当前帧信息检测的,也有利用连续帧的相关信息检测的。后者最常用的方法是帧间差分。常用的目标检测方法有四类:Point Detector: Moravec's 算子, Harris算子, SIFT算子, Affine Invariant Point DetectorSegmentation: MeanShift, Graph-Cut, Active ContourBackground Modeling: 混合高斯模型, Eigenbackground, Wall flower, 动态纹理背景Supervised Classifi 阅读全文
posted @ 2011-06-09 01:37 飞夺泸定桥 阅读(1362) 评论(0) 推荐(0) 编辑

摘要: 图像特征最重要的属性是独特性,能够咋特征空间内方便区分目标。可用于跟踪的特征有颜色、边缘、光流和纹理,或者是其中几种的组合。颜色-最常用的颜色空间是RGB,但它不是均匀分布的;均匀分布的颜色空间是HSV。根据应用选择合适的颜色空间。边缘-边缘通常伴随着剧烈的intensity变化。对比于颜色特征,边缘特征对光照变化不敏感。最流行的边缘检测算法是Canny算子。光流-光流特征是定义区域内每个像素变化的稠密位移向量域。通过计算区域内的光照对比度变化得到。通常应用在基于运动的分割和跟踪上。纹理-纹理是检测物体表面intensity变化的手段,是对光滑程度和规则程度的量化。相对于颜色,它多了一个计算描 阅读全文
posted @ 2011-06-09 01:32 飞夺泸定桥 阅读(785) 评论(0) 推荐(0) 编辑

摘要: 轮廓跟踪形状复杂的目标难以用简单的几何形状来表示。基于轮廓的方法提供了较为准确的形状描述。这类方法的主要思想是用先前帧建立的目标模型找到当前帧的目标区域。其中目标模型可以是颜色直方图、目标边缘或者轮廓。基于轮廓的跟踪方法可以分为两类:形状匹配方法和轮廓跟踪方法。前者在当前帧中搜索目标性状,后者则通过状态空间模型或直接的能量最小化函数推演初始轮廓在当前帧中的新位置。1 形状匹配方法 这种方法类似于基于模板的跟踪,在当前帧中搜索目标的轮廓和相关模型。Huttenlocher et al.[1993] - 用基于边缘的表达方式进行形状匹配,用Hausdorff距离进行匹配测量。Li et al. [ 阅读全文
posted @ 2011-06-09 01:31 飞夺泸定桥 阅读(2610) 评论(0) 推荐(0) 编辑

摘要: 这7个不变矩构成一组特征量,Hu.M.K在1962年证明了他们具有旋转,缩放和平移不变性。 实际上,在对图片中物体的识别过程中,只有M1 和M2 不变性保持的比较好,其他的几个不变矩带来的误差比较大,有学者认为只有基于二阶矩的不变矩对二维物体的描述才是真正的具有旋转、缩放和平移不变性(M1 和M2 刚好都是由二阶矩组成的)。不过我没有证明是否是真的事这样的。 由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低,我做过手势识别,对于已经分割好的手势轮廓图,识别率也就30%左右,对于纹理比较丰富的图片,识别率更是不堪入眼,只有10%左右。这一部分原因是由于Hu不变矩只用到低阶 阅读全文
posted @ 2011-06-09 00:30 飞夺泸定桥 阅读(9877) 评论(0) 推荐(0) 编辑