齐次坐标的另一个角度的理解

关于齐次坐标

按照通常使用的数学知识,二维平面上一个点可以用它在X、Y方向上的坐标来标示为 P(x,y),但是在图形学中偏偏要‘画蛇添足’的使用齐次坐标,这样我们必须使用一个三维向量来表示一个二维点即P(x,y,w),最后一个w就是那个‘足’。
      why?
      首先想像有个绝对不变的坐标系,记为W,然后以W为参照,建立两个坐标系O1和O2, O1的原点在W的(1,1)处,O2的原点在W的(2,2)处。
      那么W中的一个点P(x,y)在O1中将变为P(x-1,y-1),在O2中将是P(x-2, y-2),这样同一个点P在不同的坐标系下就具有了不同的表示。这会产生一个问题:显然,P点在二维空间的位置是唯一的,是与坐标系无关的,而不同坐标系下的表示看上去体现不了这种无关性。
      The Key
      我们使用的是坐标系这样一个概念,坐标系忽略了坐标原点所具有的重要意义:正是原点标示了该坐标系处于哪个参照位置。如果用矩阵来表示一个二维坐标系,将会是如下形式:
|1  0|
|0  1| ,其中(1 0)T表示一个基矢量,(0 1)T表示另一个基矢量,它们互相垂直,因此能利用它们标记整个二维空间。
(x, y)|1 0| = (x, y) |0 1|
这就是二维坐标的实际意义。
 
      现在考虑将坐标原点(a,b)也引入到这个矩阵表示中来:
                                           |1 0 |
                                           |0 1 |
                                           |a b |
      我们用这个矩阵可以表示二维空间中任意位置的一个坐标系,当然,这个坐标系的基矢量可以不为(0 1)T和(1 0)T,为了和坐标系区分,我们称这种新表示为标架表示。
      好,问题来了,如果我们仍然用(x y)来表示点P,那么根据矩阵的乘法规则,我们无法完成其乘法:mx N 的矩阵只能和 N xk的矩阵相乘。解决的办法就是: 给P点添一个尾巴,这个尾巴通常为1:P(x y 1),这就是P的齐次坐标,利用新的齐次坐标和矩阵相乘得到的结果为:
(x+a, y+b),这样同一个点在不同标架下的不同表示最终会得到同一个计算结果,它反映了这样一个事实:同一个点在不同标架下的不同表示其实是等价的,这一点恰恰是使用坐标系无法体现出来的。
      显然上面那个 3x2的矩阵和P的齐次表示相乘得到的不是齐次坐标,所以应该将它扩充成3x3的方阵:
                                     |1 0 0|
                                     |0 1 0|
                                     |a b 1|
     经过扩充以后的新矩阵具有一些有趣的特性:利用它可以非常轻松的实现平移、旋转以及缩放和剪切变换。
 
      齐次坐标表示是计算机图形学的重要手段之一,它既能够用来明确区分向量和点,同时也更易用于进行仿射(线性)几何变换。”
—— F.S. Hill, JR。

      对于一个向量v以及基oabc,可以找到一组坐标(v1,v2,v3),使得v = v1 a + v2 b + v3 c (1),而对于一个点p,则可以找到一组坐标(p1,p2,p3),使得 p - o = p1 a + p2 b + p3 c (2) 从上面对向量和点的表达,我们可以看出为了在坐标系中表示一个点(如p),我们把点的位置看作是对这个基的原点o所进行的一个位移,即一个向量--p - o(有的书中把这样的向量叫做位置向量--起始于坐标原点的特殊向量),我们在表达这个向量的同时用等价的方式表达出了点p:p = o + p1 a + p2 b + p3 c (3)。(1)(3)是坐标系下表达一个向量和点的不同表达方式。这里可以看出,虽然都是用代数分量的形式表达向量和点,但表达一个点比一个向量需要额外的信息。如果我写出一个代数分量表达(1, 4, 7),谁知道它是个向量还是个点!

      我们现在把(1)(3)写成矩阵的形式:v = (v1 v2 v3 0) X (a b c o),p = (p1 p2 p3 1) X (a b c o),这里(a,b,c,o)是坐标基矩阵,右边的列向量分别是向量v和点p在基下的坐标。这样,向量和点在同一个基下就有了不同的表达:3D向量的第4个代数分量是0,而3D点的第4个代数分量是1。像这种这种用4个代数分量表示3D几何概念的方式是一种齐次坐标表示。

      这样,上面的(1, 4, 7)如果写成(1,4,7,0),它就是个向量;如果是(1,4,7,1),它就是个点。下面是如何在普通坐标(Ordinary Coordinate)和齐次坐标(Homogeneous Coordinate)之间进行转换: (1)从普通坐标转换成齐次坐标时,如果(x,y,z)是个点,则变为(x,y,z,1);如果(x,y,z)是个向量,则变为(x,y,z,0)

(2)从齐次坐标转换成普通坐标时 ,如果是(x,y,z,1),则知道它是个点,变成(x,y,z);如果是(x,y,z,0),则知道它是个向量,仍然变成(x,y,z)

      以上是通过齐次坐标来区分向量和点的方式。从中可以思考得知,对于平移T、旋转R、缩放S这3个最常见的仿射变换,平移变换只对于点才有意义,因为普通向量没有位置概念,只有大小和方向.

      而旋转和缩放对于向量和点都有意义,你可以用类似上面齐次表示来检测。从中可以看出,齐次坐标用于仿射变换非常方便。

此外,对于一个普通坐标的点P=(Px, Py, Pz),有对应的一族齐次坐标(wPx, wPy, wPz, w),其中w不等于零。比如,P(1, 4, 7)的齐次坐标有(1, 4, 7, 1)、(2, 8, 14, 2)、(-0.1, -0.4, -0.7, -0.1)等等。因此,如果把一个点从普通坐标变成齐次坐标,给x,y,z乘上同一个非零数w,然后增加第4个分量w;如果把一个齐次坐标转换成普通坐标,把前三个坐标同时除以第4个坐标,然后去掉第4个分量。

      由于齐次坐标使用了4个分量来表达3D概念,使得平移变换可以使用矩阵进行,从而如F.S. Hill, JR所说,仿射(线性)变换的进行更加方便。由于图形硬件已经普遍地支持齐次坐标与矩阵乘法,因此更加促进了齐次坐标使用,使得它似乎成为图形学中的一个标准。

      以上很好的阐释了齐次坐标的作用及运用齐次坐标的好处。其实在图形学的理论中,很多已经被封装的好的API也是很有研究的,要想成为一名专业的计算机图形学的学习者,除了知其然必须还得知其所以然。这样在遇到问题的时候才能迅速定位问题的根源,从而解决问题。

 
posted @ 2011-12-24 13:21  zyx2007  阅读(449)  评论(0编辑  收藏  举报