跟小D每日学口语

2012年9月5日

马尔可夫模型及隐马尔可夫模型(HMM)

摘要: 马尔科可模型 马尔可夫模型是由Andrei A. Markov于1913年提出的 $\bullet$ 设 $S $是一个由有限个状态组成的集合 $S=\{1, 2, 3, …,n-1, n\}$随机序列 $X $ 在 $ t $时刻所处的状态为 $ q_t$,其中 $q_t \in S$,若有: \[ P(q_t=j |q_{t-1}=i, q_{t-2}=k,\cdots)=P(q_t=j |... 阅读全文

posted @ 2012-09-05 11:13 湘厦人 阅读(3011) 评论(1) 推荐(0) 编辑

2012年3月8日

Zdenek Kalal的TLD Tracker

摘要: Kalal是英国萨里大学的一个捷克学生。他演示的是他的神奇的精确定位系统,这个系统几乎可以跟踪镜头里的任何物体,只要你能看见它,并把它选中。它能 做很多神情的事情。在这个视频中,他演示了通过摄像机拍摄他的手指、把他的手指选做目标。系统于是就能精确的跟踪他的手指的动作。更令人惊奇的是,这个系 统能够通过分析物体的运动来完善跟踪算法。你能在很短的时间里教会它跟踪你的手指、面孔或在高速公路上狂颠的轿车。有了这套系统,我们几乎真的可以实 现”Minority Report“那样的人机界面。就像微软Xbox的Kinect那样,而这个效果更好。Kalal有12个视频来演示 他的这套算法都能做什么。只要你有 阅读全文

posted @ 2012-03-08 23:33 湘厦人 阅读(2038) 评论(0) 推荐(0) 编辑

2011年12月20日

计算机视觉基础5——本质矩阵与基本矩阵(Essential and Fundamental Matrices)

摘要: 回顾本质矩阵的定义本质矩阵的基本性质:结合成像的几何关系 Longuet-Higgins equation注意大小写的区别哦,大小表示物点矢量,小与表示像点矢量。像平面上的一点可以看作:• (u,v) 2D film point(局限于像平面上来考虑)• (u,v,f) 3D point on film plane(相机坐标系中来考虑)• k(u,v,f) viewing ray into the scene(透过像点和原点射线上点的像,相机坐标系中来考虑)• k(X, Y, Z) ray through point P in the scene(在世界坐标系中来考虑)设$l$为像平... 阅读全文

posted @ 2011-12-20 15:57 湘厦人 阅读(12694) 评论(4) 推荐(3) 编辑

计算机视觉基础4——对极几何(Epipolar Geometry)

摘要: 先思考一个问题:用两个相机在不同的位置拍摄同一物体,如果两张照片中的景物有重叠的部分,我们有理由相信,这两张照片之间存在一定的对应关系,本节的任务就是如何描述它们之间的对应关系,描述工具是对极几何 ,它是研究立体视觉的重要数学方法。 要寻找两幅图像之间的对应关系,最直接的方法就是逐点匹配,如果加以一定的约束条件对极约束(epipolar constraint),搜索的范围可以大大减小。 先回顾简单的立体成像系统对极约束的图示更一般的立体成像关系:两个相机的坐标无任何约束关系,相机的内部参数可能不同,甚至是未知的。要刻画这种情况下的两幅图像之间的对应关系,需要引入两个重要的概念——对极矩... 阅读全文

posted @ 2011-12-20 12:41 湘厦人 阅读(19191) 评论(0) 推荐(3) 编辑

共面点成像——planar homography

摘要: 在前面已经讨论了三维物体成像过程,相比之下,还有一种稍简单的情况——平面成像,即所有的物点都处在同一个平面上,我们有理由相信,这种情况下的成像关系是一般立体成像的一种特例。先回顾一下一般的单体成像过程 对于共面的物点,在恰当的世界坐标系中,可以令其中一个坐标值为0,不妨设第三维坐标为0,图示如下:由于物点的第三维坐标为0,整个成像过程的矩阵表示会得到简化。可以简化为一个3X3的矩阵,称之为Homography矩阵,该矩阵是可逆的!!对于正前方的物体平面(垂直于光轴),成像关系将更进一步简化。将共面物点经成像之后,再变换为数字图像(u,v)研究共面点成像有什么意义呢?原来是为了研究两幅图之间.. 阅读全文

posted @ 2011-12-20 10:40 湘厦人 阅读(4848) 评论(0) 推荐(0) 编辑

2011年12月19日

计算机视觉基础3——内部参数描述

摘要: 在上一节中,我们用矩阵描述了外部参数,即物体的坐标到相机坐标的变换。同时还分析了透视投影,即成像的过程,整个过程就是从(U,V,W)->(X,Y,X)->(x,y)。这一节主要讨论如何从像平面(x,y)变换到数字图像(u,v),即从像平面(Film Coords)到像素(Pixel Coords)。对一幅数字图像,我们可以改变它的宽高比,即作尺度变换。将尺度变换与透视投影结合,用矩阵表示为尺度变换是一种仿射变换,因此,将从(X,Y,X)到(u,v)的变换可以写为整个成像过程就是:补充点高等几何的知识:变换1. 平移2. 尺度变换3. 旋转4. 刚体运动5. 刚体+尺度变换6. 仿射 阅读全文

posted @ 2011-12-19 23:03 湘厦人 阅读(5230) 评论(0) 推荐(0) 编辑

计算机视觉基础2——相机成像的几何描述

摘要: 试想像一下,很多游客同时在不同角度拍摄Eiffel Tower(埃菲尔铁塔),该如何用数学的方法来描述这一过程呢?首先要解决的问题就是定位,或者说坐标选定的问题,埃菲尔铁塔只有一座,如果按经、纬度来刻画,它的坐标是唯一确定的,但游客显然不关系这一点,他(她)只按自己的喜好选择角度和位置,因此,物体(景物)有物体的坐标系统,相机有相机的坐标系统,即便同一个相机,当调整参数时,在同样的位置、相同的角度,也可能得到不同的图像。为了统一描述,有必要引入世界坐标(或物体坐标)、相机坐标和像平面坐标。世界坐标用UVW记。相机坐标用XYZ记。中学物理告诉我们,物体与像是倒的关系,但作为数学分析,我们采用虚. 阅读全文

posted @ 2011-12-19 22:21 湘厦人 阅读(6325) 评论(0) 推荐(3) 编辑

计算机视觉基础1——视差与深度信息

摘要: 资料来源:Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras.基本透视投影透视投影是多对一的关系,投影线上的任何一点对应同一个像点。如果用两个摄像机,则可以消除这种多对一,从而能够确定第三维坐标Z的值,即深度信息。为什么可以感知深度信息呢?我们的左右眼从略微不同的角度观察景物,而这种视差与物体所 阅读全文

posted @ 2011-12-19 20:16 湘厦人 阅读(10838) 评论(2) 推荐(6) 编辑

导航