计算机中图像的表示
最简单的图就是单通道的灰度图。在一张灰度图中,每个像素位置(x,y)对应一个灰度值I,图像在计算机中就存储为数值矩阵。
一张宽度为640像素,高度为480像素分辨率的灰度图就可以表示为
unsigned char image[480][640]
为什么这里的二维数组是 480 × 640 呢?因为在程序中,图像以一个二维数组形式存储。它的第一个下标则是指数组的行,而第二个下标是列。在图像中,数组的行数对应图像的高度,而列数对应图像的宽度。
当我们访问某一个像素时,需要指明它所处的坐标,请看下图。
左边显示了传统像素坐标系的定义方式。一个像素坐标系原点位于图像的左上角,X 轴向右,Y 轴向下(也就是前面所说的 u, v 坐标)。如果它还有第三个轴的话,根据右手法则,Z 轴应该是向前的。这种定义方式是与相机坐标系一致的。我们平时说的图
像的宽度和列数,对应着 X 轴;而图像的行数或高度,则对应着它的 Y 轴。
根据这种定义方式,如果我们讨论一个位于 x, y 处的像素,那么它在程序中的访问方
式应该是:
unsigned char pixel = image[y][x];
它对应着灰度值 I(x, y) 的读数。请注意这里的 x 和 y 的顺序。虽然我们有些繁琐的讨论坐标系的问题,但是像这种下标顺序的错误,会是新手在调试过程中经常碰到
的,又具有一定隐蔽性的错误之一。如果你在写程序时不慎调换了 x, y 的坐标,编译器无法提供任何信息,而你能看到的只是程序运行中的一个越界错误而已。