Fork me on GitHub

齐次坐标的理解

1. 齐次

事实上带齐次的概念很多,纯粹要说“齐次”的含义的话,似乎比较抽象难懂,所以我觉得给出一个具体的齐次的东西来解释可能会更好一点。

下面我要解释的齐次坐标(homogeneous coordinates)是我所熟悉的计算机视觉和图形学这两个领域中经常要用到的概念,同时,坐标也是一般人都可以理解的东西。

二维空间中的一个点是用二元组(x, y)表示的。我们可以增加一个额外的坐标得到三元组(x, y, 1),同时我们声明这是同一个点。这看起来完全无害,因为我们可以很简单地通过增加或者删除最后一个坐标值来在两种表示方式之间来回切换。现在,有一个很重要的问题是:最后一个坐标为什么需要是1?毕竟,另外两个数字没有这样的限制呀。比方说(x, y, 2)。在这里,我们要再给出一个定义,即当k非零时,所有形如(kx, ky,k)的三元组都表示同一个点,比如(x, y, 1)(2x, 2y,2)就表示同一个点。由此我们就可以引出齐次坐标的定义,即给定一个二维点(x, y),那么形如(kx, ky,k)的所有三元组就都是等价的,它们就是这个点的齐次坐标。对每一个齐次坐标,我们只要把它除以三元组中的第三个数,即可得到原始的二维点坐标(这就是@祝文祥的答案中所说的同比收缩的一个例子)。不过我觉得,从字面上来看,齐次坐标这个叫法还是不那么形象,不过看看和齐次对应的英文单词homogeneous,我们会发现这个词有时还会被翻译成“同质”,表示某一类东西拥有一些相同的性质,这么来看的话,还是挺形象的吧。

需要再次注意的是这里的k是非零的,那么如果k=0会怎样?因为除数不能为0的缘故,所以似乎没有任何二维点是和(x, y,0)对应的。事实上,(x, y,0)就是无穷远处的点。以前,我们用(x, y)是无法描述二维平面上的无穷远点,但当我们引入齐次坐标之后,就可以用(x, y,0)来表示无穷远点了。这就是引入齐次坐标的一个好处。当然了,使用齐次坐标还有很多好处。事实上,没很多好处,我们干嘛要多用一个数字来表示二维点呀,多麻烦你说是吧。

以上关于齐次坐标的内容翻译并修改自《Multiview Geometry in Computer Vision (2nd Edition)》第2页第9行开始的两段。

2. 线性

再来说说“线性”。和“齐次”类似,带“线性”的概念也很多,下面我也会给出一个具体的线性的东西来解释,以防过于抽象。

“线性变换”(Linear Transformation)同样是计算机视觉和图形学中经常用到的东西。通常,我们会用一个矩阵来表示一个线性变换,对于二维空间中的线性变换,我们经常用3x3的矩阵来表示。当给定一个线性变换矩阵之后,我们把它和一个齐次坐标一乘就可以得到经过变换后的齐次坐标了。

那么为什么我们要管这种变换叫线性变换而不是弯性变换呢?这里抛开线性的数学定义不说,线性变换有一个重要的性质,非常形象地表达了这一概念,即保共线性(我记不清是不是叫这个名字了,望指正)。具体地说就是,在线性变换之前处于同一条直线上的3个点,经过线性变换之后必定还处于同一条直线上。换句话说,如果你画了一条直线,这条直线在经过线性变换之后它必定还是一条直线。

所以说,线性变换最喜欢直线了,除了直线以外的东西,比如角,在经过线性变换之后可能就完全不一样了,此外,还有长度、面积、平行等等,线性变换都不喜欢,不保证它们在变换之后还能维持原样。

以上,希望能帮助大家理解这两个概念。

posted @ 2016-10-07 18:47  stardsd  阅读(8553)  评论(1编辑  收藏  举报