湘厦人 - 博客园

2012年9月5日

马尔可夫模型及隐马尔可夫模型(HMM)

摘要：马尔科可模型马尔可夫模型是由Andrei A. Markov于1913年提出的 $\bullet$ 设 $S $是一个由有限个状态组成的集合 $S=\{1, 2, 3, …,n-1, n\}$随机序列 $X $ 在 $ t $时刻所处的状态为 $ q_t$，其中 $q_t \in S$，若有： \[ P(q_t=j |q_{t-1}=i, q_{t-2}=k,\cdots)=P(q_t=j |... 阅读全文

posted @ 2012-09-05 11:13 湘厦人阅读(3011) 评论(1) 推荐(0) 编辑

2012年3月8日

Zdenek Kalal的TLD Tracker

摘要： Kalal是英国萨里大学的一个捷克学生。他演示的是他的神奇的精确定位系统，这个系统几乎可以跟踪镜头里的任何物体，只要你能看见它，并把它选中。它能做很多神情的事情。在这个视频中，他演示了通过摄像机拍摄他的手指、把他的手指选做目标。系统于是就能精确的跟踪他的手指的动作。更令人惊奇的是，这个系统能够通过分析物体的运动来完善跟踪算法。你能在很短的时间里教会它跟踪你的手指、面孔或在高速公路上狂颠的轿车。有了这套系统，我们几乎真的可以实现”Minority Report“那样的人机界面。就像微软Xbox的Kinect那样，而这个效果更好。Kalal有12个视频来演示他的这套算法都能做什么。只要你有阅读全文

posted @ 2012-03-08 23:33 湘厦人阅读(2038) 评论(0) 推荐(0) 编辑

2011年12月20日

计算机视觉基础5——本质矩阵与基本矩阵(Essential and Fundamental Matrices)

摘要：回顾本质矩阵的定义本质矩阵的基本性质：结合成像的几何关系 Longuet-Higgins equation注意大小写的区别哦，大小表示物点矢量，小与表示像点矢量。像平面上的一点可以看作：• (u,v) 2D film point(局限于像平面上来考虑)• (u,v,f) 3D point on film plane(相机坐标系中来考虑)• k(u,v,f) viewing ray into the scene(透过像点和原点射线上点的像，相机坐标系中来考虑)• k(X, Y, Z) ray through point P in the scene(在世界坐标系中来考虑)设$l$为像平... 阅读全文

posted @ 2011-12-20 15:57 湘厦人阅读(12694) 评论(4) 推荐(3) 编辑

计算机视觉基础4——对极几何(Epipolar Geometry)

摘要：先思考一个问题：用两个相机在不同的位置拍摄同一物体，如果两张照片中的景物有重叠的部分，我们有理由相信，这两张照片之间存在一定的对应关系，本节的任务就是如何描述它们之间的对应关系，描述工具是对极几何，它是研究立体视觉的重要数学方法。要寻找两幅图像之间的对应关系，最直接的方法就是逐点匹配，如果加以一定的约束条件对极约束(epipolar constraint)，搜索的范围可以大大减小。先回顾简单的立体成像系统对极约束的图示更一般的立体成像关系：两个相机的坐标无任何约束关系，相机的内部参数可能不同，甚至是未知的。要刻画这种情况下的两幅图像之间的对应关系，需要引入两个重要的概念——对极矩... 阅读全文

posted @ 2011-12-20 12:41 湘厦人阅读(19191) 评论(0) 推荐(3) 编辑

共面点成像——planar homography

摘要：在前面已经讨论了三维物体成像过程，相比之下，还有一种稍简单的情况——平面成像，即所有的物点都处在同一个平面上，我们有理由相信，这种情况下的成像关系是一般立体成像的一种特例。先回顾一下一般的单体成像过程对于共面的物点，在恰当的世界坐标系中，可以令其中一个坐标值为0，不妨设第三维坐标为0，图示如下：由于物点的第三维坐标为0，整个成像过程的矩阵表示会得到简化。可以简化为一个3X3的矩阵，称之为Homography矩阵，该矩阵是可逆的!!对于正前方的物体平面(垂直于光轴)，成像关系将更进一步简化。将共面物点经成像之后，再变换为数字图像(u,v)研究共面点成像有什么意义呢？原来是为了研究两幅图之间.. 阅读全文

posted @ 2011-12-20 10:40 湘厦人阅读(4848) 评论(0) 推荐(0) 编辑

2011年12月19日

计算机视觉基础3——内部参数描述

摘要：在上一节中，我们用矩阵描述了外部参数，即物体的坐标到相机坐标的变换。同时还分析了透视投影，即成像的过程，整个过程就是从(U,V,W)->(X,Y,X)->(x,y)。这一节主要讨论如何从像平面(x,y)变换到数字图像(u,v)，即从像平面(Film Coords)到像素(Pixel Coords)。对一幅数字图像，我们可以改变它的宽高比，即作尺度变换。将尺度变换与透视投影结合，用矩阵表示为尺度变换是一种仿射变换，因此，将从(X,Y,X)到(u,v)的变换可以写为整个成像过程就是：补充点高等几何的知识：变换1. 平移2. 尺度变换3. 旋转4. 刚体运动5. 刚体+尺度变换6. 仿射阅读全文

posted @ 2011-12-19 23:03 湘厦人阅读(5230) 评论(0) 推荐(0) 编辑

计算机视觉基础2——相机成像的几何描述

摘要：试想像一下，很多游客同时在不同角度拍摄Eiffel Tower(埃菲尔铁塔)，该如何用数学的方法来描述这一过程呢？首先要解决的问题就是定位，或者说坐标选定的问题，埃菲尔铁塔只有一座，如果按经、纬度来刻画，它的坐标是唯一确定的，但游客显然不关系这一点，他(她)只按自己的喜好选择角度和位置，因此，物体(景物)有物体的坐标系统，相机有相机的坐标系统，即便同一个相机，当调整参数时，在同样的位置、相同的角度，也可能得到不同的图像。为了统一描述，有必要引入世界坐标(或物体坐标)、相机坐标和像平面坐标。世界坐标用UVW记。相机坐标用XYZ记。中学物理告诉我们，物体与像是倒的关系，但作为数学分析，我们采用虚. 阅读全文

posted @ 2011-12-19 22:21 湘厦人阅读(6325) 评论(0) 推荐(3) 编辑

计算机视觉基础1——视差与深度信息

摘要：资料来源：Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂，此处，我们只从物理角度，并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras.基本透视投影透视投影是多对一的关系，投影线上的任何一点对应同一个像点。如果用两个摄像机，则可以消除这种多对一，从而能够确定第三维坐标Z的值，即深度信息。为什么可以感知深度信息呢？我们的左右眼从略微不同的角度观察景物，而这种视差与物体所阅读全文

posted @ 2011-12-19 20:16 湘厦人阅读(10838) 评论(2) 推荐(6) 编辑