跟小D每日学口语

2011年12月19日

计算机视觉基础3——内部参数描述

摘要: 在上一节中,我们用矩阵描述了外部参数,即物体的坐标到相机坐标的变换。同时还分析了透视投影,即成像的过程,整个过程就是从(U,V,W)->(X,Y,X)->(x,y)。这一节主要讨论如何从像平面(x,y)变换到数字图像(u,v),即从像平面(Film Coords)到像素(Pixel Coords)。对一幅数字图像,我们可以改变它的宽高比,即作尺度变换。将尺度变换与透视投影结合,用矩阵表示为尺度变换是一种仿射变换,因此,将从(X,Y,X)到(u,v)的变换可以写为整个成像过程就是:补充点高等几何的知识:变换1. 平移2. 尺度变换3. 旋转4. 刚体运动5. 刚体+尺度变换6. 仿射 阅读全文

posted @ 2011-12-19 23:03 湘厦人 阅读(5233) 评论(0) 推荐(0) 编辑

计算机视觉基础2——相机成像的几何描述

摘要: 试想像一下,很多游客同时在不同角度拍摄Eiffel Tower(埃菲尔铁塔),该如何用数学的方法来描述这一过程呢?首先要解决的问题就是定位,或者说坐标选定的问题,埃菲尔铁塔只有一座,如果按经、纬度来刻画,它的坐标是唯一确定的,但游客显然不关系这一点,他(她)只按自己的喜好选择角度和位置,因此,物体(景物)有物体的坐标系统,相机有相机的坐标系统,即便同一个相机,当调整参数时,在同样的位置、相同的角度,也可能得到不同的图像。为了统一描述,有必要引入世界坐标(或物体坐标)、相机坐标和像平面坐标。世界坐标用UVW记。相机坐标用XYZ记。中学物理告诉我们,物体与像是倒的关系,但作为数学分析,我们采用虚. 阅读全文

posted @ 2011-12-19 22:21 湘厦人 阅读(6330) 评论(0) 推荐(3) 编辑

计算机视觉基础1——视差与深度信息

摘要: 资料来源:Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras.基本透视投影透视投影是多对一的关系,投影线上的任何一点对应同一个像点。如果用两个摄像机,则可以消除这种多对一,从而能够确定第三维坐标Z的值,即深度信息。为什么可以感知深度信息呢?我们的左右眼从略微不同的角度观察景物,而这种视差与物体所 阅读全文

posted @ 2011-12-19 20:16 湘厦人 阅读(10863) 评论(2) 推荐(6) 编辑

导航