代码改变世界

计算机图像处理界的永恒微笑(转载)

2009-07-27 14:28  Johnny Qian  阅读(813)  评论(0编辑  收藏  举报

(文章出处:CnBeta.com中文业界资讯http://www.cnbeta.com/articles/89561.htm

“玩伴女郎”雷娜:计算机图像处理界的永恒微笑

本文来源科学松鼠会,原文标题为“玩伴女郎”误入学术圈,作者Robot
她是让无数专家为之痴迷和痛苦的研究对象,她是充斥着枯燥数学公式的论文中最吸引眼球的光芒,翻开任何一本关于计算机图像处理的教材,你都能看到她动人的微笑。她就是雷娜(Lena),她的照片是图像处理领域使用最为广泛的标准测试图。她是真人吗?她到底从何而来?

lena
1、事件起因 一举成名计算机界知

1973年的夏天,美国南加州大学信号与图像处理研究所里,年轻的助理教授亚历山大(Alexander Sawchuk)和研究员威廉(William Pratt)正为一篇学术论文忙碌,试图从一叠常用的测试图片中找出一张适合测试压缩算法的图片:最好是人脸,表面光滑,内容多层次。不过这些单调陈旧,如同早期电视画面的图片很快就让他们失望了。历史在这里开了个小小的玩笑,正巧有人拿着一本《花花公子》杂志(1972年11月刊)到实验室来“串门”,当期的玩伴女郎雷娜(Lena Söderberg)立刻吸引了众人的目光。亚历山大发现这张有着光滑面庞和繁杂饰物的图片正好符合要求,于是,他们撕下这张彩图,将上半部扫描成一张 512×512像素大小的图片,“雷娜图”就此诞生。

雷娜图(黑白版)

雷娜图(黑白版)

亚历山大并未觉得有任何不妥的地方,他用这张图片测试了自己的压缩算法,满意地完成了论文。而对于这一切,远在芝加哥的雷娜一无所知,在结束自己的模特生涯后,她回到瑞典的故乡,结婚生子,无从知晓自己将成为一个学术圈里的传奇人物。在亚历山大的论文发表后,不断有同行向他索要原始的扫描件,以便能同他们自己的图像压缩算法进行效果比较。久而久之,这张图片成为了图像处理领域的一个标准测试图,只要支付一小笔费用,你就能从南加州大学得到原始的扫描件拷贝,而大多数研究者奋斗的目标只有一个:如何在保证图片质量的同时让它的压缩率高一点,再高一点。

随着这张标准图在学术圈的流行,不少人开始对这位迷人的女郎产生了兴趣。1988年,一家瑞典的电脑出版社联系并采访到了雷娜,这是她十五年来首次得知自己的照片被应用在计算机行业里,兴奋和惊讶之情溢于言表。1997年,在《花花公子》杂志社的帮助下,图像科学和技术会议(IS&T)的筹办方正式邀请雷娜参加于当年五月份在波士顿召开的五十周年大会。这离当初雷娜图的诞生,已经过去了约四分之一个世纪,当初的年轻教授已成为业内的知名学者,而红颜少女的鬓边终于也见到了白发。“他们肯定早已厌烦我了,这么多年都看着同一张照片。”雷娜在会议上受到了热情的欢迎,她看到了许多基于雷娜图的研究工作,并忙于在一张又一张自己的照片上签名。

雷娜和邀请她的IST会议主席
雷娜和邀请她的IST会议主席

雷娜在IST会议上
雷娜在IST会议上

2、版权之争 “盗用”带来一纸风行

1991年,学术期刊《光学工程》(Optical Engineering)使用雷娜图作为其7月刊的封面。至此,《花花公子》才得知这张图片已然在学术界被“盗用”了18年之久(由此我们亦可得知学术界和娱乐界是多么的不通往来)。当初的无心之举使得照片的版权问题终于浮出水面。《花花公子》正式致函《光学工程》的出版者国际光学工程学会( SPIE ),要求在其之后出版物中任何使用雷娜图的地方都要事先得到授权。作为业内最流行的标准测试图,完全依循此要求无疑将会给遍布全球的研究者们带来极大的不便。不得已,SPIE在回复中解释了雷娜图在学术界的使用现状,并且指出自己是一个非盈利科学协会,出版物只供教育和研究使用。面对既成事实,《花花公子》亦乐得慷慨,表示不会追究雷娜图在学术领域造成的侵权问题。

在这起小小的纠纷之后,学术界对于论文图片的版权问题更加注意。(值得一提的是,雷娜图并不是首次用于图像处理领域的《花花公子》图片,早在1961年,麻省理工大学的一位学生就在自己的硕士论文中使用了一张事先得到授权的《花花公子》图片。)而对于广大使用雷娜图的研究者来说,他们从此可以免费从南加州的大学得到雷娜图了。大度的杂志社也没有吃亏,刊有雷娜的那一期《花花公子》,是它历史上卖的最好的一期,总共售出了超过700万份(Geek们的购买力是很惊人的!)。

版权的风波已经过去,但关于雷娜图的争议还在继续。

3、技术之争 “雷娜图”并非完美无缺

雷娜图(轮廓版)
雷娜图(轮廓版)

雷娜图为何如此受欢迎?《IEEE图像处理期刊》的主编大卫(David Munson)认为有两个原因: “首先,这张图片含有细节部分、平坦区域、阴影和纹理,有利于测试各种不同的图像处理算法。其次,这是一个非常迷人的女性照片,图像处理领域(多数人为男性)愿意使用一张他们认为很有吸引力的图片也并不令人惊奇。” 这张图片含有丰富的频段,包括处于低频的光滑皮肤和处于高频的羽毛,很适合做为测试图片。而人眼对于人脸的细节差别感受也远比一般的景物更为明显。不过,这也并不意味着雷娜图是完美无缺的。

当年扫描雷娜图使用的是如今看来很落后的扫描仪和计算机。由于软件错误,亚历山大只得到了511行(预计是512行)数据,图片最上面一行的数据是复制而来的,这造成了边缘的些微瑕疵。由于扫描仪上数模转换器的计时器问题,扫描件相比原件有略微的拉长变形——亚历山大如果知道这会是一张标准图,一定会更小心些的。最重要的是,作为一张标准图,雷娜图缺少了很多关键信息,例如所用胶片、光线环境、印刷环境、扫描仪型号等等。上世纪70年代以来,图像技术已经有了很大的改进,完全能够制作出一幅比雷娜图更“标准”的标准图来。不过,雷娜图的粉丝们理直气壮:“研究者们对雷娜图非常熟悉,能够轻易地判断出压缩算法的好坏。”也有不少人赞成用今天的技术重新扫描原始图片,得到新的标准雷娜图。

4、性别之争 此图涉嫌性别歧视?

雷娜图(变形版)
雷娜图(变形版)

扫描雷娜图时所用的扫描仪在每英寸长度上可以产生100条扫描线,所以共512行的雷娜图只显示原图上方5.12英寸的范围,正好展示出雷娜漂亮的肩部。这掩盖不了一个事实:原图是一张裸照。正所谓成也萧何,败也萧何,随着越来越多的女性研究者进入图像处理领域,性别歧视无疑是雷娜图面临的最大问题。

1997年,《电子工程专辑》(Electronic Engineering Times)的编辑桑尼(Sunny Bains)在同出版社商量之后,决定在自己的工作范围内封杀雷娜图。她解释说:“一个女性在一个由男性主导的领域里工作是很容易感到被孤立的,在学术杂志上看到这种有争议的图片将会加重这种不被接受的感觉。”据说,她收到了不少来自女性的感谢信,也没人抱怨这影响了工作。无独有偶,纽约州立大学石溪分校的教授特奥(Theo Pavlidis)在编写计算机图形学教材时,也因为编辑的坚持,将雷娜图换成了其他图片。

作为引用雷娜图最多的期刊编辑,大卫也接到了不少的投诉:“很多人希望我封杀雷娜图,人们并不是反对图片本身,而是认为它来源于一本‘利用’女性的杂志。”他提供的办法则更为折中:不用封杀雷娜图,而是鼓励作者多用其他的图片。

时至今日,雷娜图仍是图像处理领域最受欢迎的测试图。不过近年来,其压倒性的优势已经有所松动。关于版权、技术和歧视的多重争议让雷娜图不堪重负,不断涌现的新测试图也为研究者们提供了更多的选择。然而无论如何,雷娜这个不经意间闯入学术圈的“玩伴女郎”,以及“她”所见证的几十年来图像压缩技术的发展,将会永远留在我们的记忆里。

另外一些废话:

作为一个女性,常常有人问我在男性主导的领域中工作是否有不满或特别困难的时候,我个人并没有遇到值得抱怨的地方。不过,积极吸引和鼓励更多的女性进入这个行业无疑比强烈反对一张有潜在歧视意味的图片来的更有意义。在这一点上,国外有很多经验值得我们借鉴,美国很多学校和机构都有特别为女性进入应用科学和工程学领域而设置的奖学金和研究经费。我博士期间的导师是一位非常出色的女性,她多次在暑假期间指导由各种机构赞助的本科女生来我们实验室进行短期(二个月左右)的研究工作。我毕业找工作时也常常能在各大学或研究所的招聘广告上发现这样的声明:“我们特别鼓励符合条件的女性来申请这个职位(qualified female candidates are strongly encouraged to apply for this position.)”。我目前工作的学校在吸引女生就读工程学专业也不遗余力,每年专门有一天是Introduce a Girl to Engineering Day,组织高中女生前来参观各个工程院系的实验室。他山之石,可以攻玉,希望中国所谓的“和尚班”和招聘会上“只招男性”的告示牌能够越来越少。

附诗一首《致雷娜》

这是一首不知名作者给雷娜的献诗,在圈中流传甚广。原作用英文写成,使用了大量的图像处理术语,表达了图像处理工作者对这位神奇的玩伴女郎的热爱。

哦,亲爱的雷娜,你的美丽是如此浩瀚而难以快速描绘

如果我能压缩你的影像,我想我能震动整个世界

唉,当我第一次使用矢量量化,我发现你的面庞只属于你自己

你那千缕丝般的长发,怎能用离散余弦变换来匹配

而你那性感的双唇,即使耗尽十三部超级计算机也找不到合适的分形碎片来形容

虽然这些挫折如此巨大,我也许还能将它们一一克服

但当滤波器夺走了你眼中的光彩,我只能说:“算了,数字化就好。”

本文已发表于本期的《新知周刊》