小传:克劳德·艾尔伍德·香农


在20世纪20年代,一个好奇心重的乡下小孩或许自然而然会对通过 电线发送讯息产生浓厚兴趣,成长于密歇根州盖洛德镇的克劳德·香农 就是如此。
他每天都能见到电线,不过它们是用来圈护牧场的刺铁丝护 栏网——由两股钢丝绞成,并带有倒刺,从一根桩子连到另一根桩子。
他会讨来他所能讨到的一切零件,临时架设起自己的铁丝网电报,向半英里外的另一个小男孩发送讯息。
他使用的是塞缪尔·摩尔斯设计的编码。
这很让他中意,他喜欢利用编码来发送讯息的主意——不仅仅是密码,还有一般意义上的编码,即用一些字词和符号来代表另一些字词和符号。
香农有着一颗爱发明、爱玩耍的心,成年之后也依然保持着那份童真。
终其一生,他都在玩游戏和发明游戏。
他爱摆弄各种小机械和小装置。
长大后的他精于抛球杂技,甚至还为此提出了一个抛球定理。
当麻省理工学院或贝尔实验室的研究员们左躲右闪为一辆独轮车让路时,那骑车的必定是香农。
除了格外爱玩,他的童年却也分外孤独。
这两点,再加上他摆弄物件的天赋,促成了他的铁丝网电报。

克劳德·埃尔伍德·香农(Claude Elwood Shannon),生于1916年,得到了个与他父亲相同的名字。
克劳德的父亲是个自己奋斗成功的商人,经营家具、不动产,承办 各项活动,还曾担任过遗嘱检验法官,克劳德出生时他已人到中年。
克劳德的祖父是个农场主,他发明过一种洗衣机,由一个防水桶、一根木制臂和一个活塞组合而成。
克劳德的母亲,梅布尔·凯瑟琳·沃尔夫 (Mabel Catherine Wolf),德国移民之女,是位语言教师,还当过一段时间的中学校长。
克劳德的姐姐,凯瑟琳·沃尔夫·香农(他们的父母在起名字时还真是节省)学习数学,会经常给弟弟出难题作为消遣。
他们全家居住在主街以北几个街区的中心街。
盖洛德镇至多不过三千居民, 但这已经足以维持一个配备有日耳曼式制服和闪亮乐器的乐队。
上小学时,克劳德就开始吹奏比他的胸口还要宽的降E大调中音号。
他有众多Erector建筑拼装玩具和图书。
他制作模型飞机,并通过为当地的西联汇款办公室投递电报来赚零花。
他还破解密码。
一个人独处时,他会把图 书读了又读。
他钟爱的一个故事是爱伦·坡写的《金甲虫》。
故事发生在美国南部的一个偏僻小岛,主人公是一个名叫威廉·勒格朗的怪人,他有着“容易兴奋的大脑”和“不同寻常的智力”,但“情绪交替无常,时而热情高亢,时而郁郁寡欢”——换言之,这正是作家自己的写照。
如此天赋卓越的主人公呼应了当时那个时代的需求,也适时地被爱伦·坡及其他敏锐的作家,如阿瑟·柯南·道尔、赫伯特·乔治·威尔斯等塑 造了出来。
《金甲虫》中的主人公通过破解写在羊皮纸上的密码,找到了埋藏的宝藏。
爱伦·坡给出了一串数字和符号(“在骷髅头和山羊之间 潦草写着如下红色符号”)——
53‡‡†305))6;4826)4‡.)4‡);806;48†8¶60))85;1‡(;:‡8†83(88)5†;46(;8896?;8)‡(;48 — 4)8¶8;4069285);)6†8)4‡‡;1(‡9;48081;8:8‡1;48†85;4)485†528806*81(‡9;48; (88;4(‡?34;48)4‡;161;:188;‡?;
——并带着读者细细梳理了这个密码的构 造和破解过程。
他的主人公宣称:“环境的影响,加上某种心智倾向, 使我对这类谜语产生了兴趣。”
显然,这会让有着类似心智倾向的读 者兴奋不已。
虽然密码的破解指引主人公找到了宝藏,但没有读者会在 乎那些金银财宝。
真正让他们兴奋的是编码,因其神秘和变化。

克劳德仅用了三年时间,而非标准的四年,就完成了盖洛德高中的学业。
1932年,他到密歇根大学就读,学习电气工程学和数学。
1936年,在临近毕业时,他在公告板上看到了一张海报,上面提供了一个麻省理工学院的研究生岗位。
时任工程学院院长的万内瓦尔·布什,需要 一名研究助理来操作他那有着奇怪名字的机器:微分分析机(Differential Analyzer)。
这是一个重达百吨、由转动的轴承和齿轮构成的铁制平台。
在报纸上,它被誉为“机械大脑”或“思考机器”,比如以下这个具有代表性的新闻标题:

“思考机器”能做高等数学;
解出人类要花数月才能求解的方程;

虽然看上去查尔斯·巴贝奇的差分机和分析机是微分分析机的远祖,但除了用语和目标有呼应外,微分分析机事实上与巴贝奇毫无关联。
布什几乎没有听说过他。
只是和巴贝奇一样,布什也厌恶单调乏味、浪费时间的纯粹计算工作。
他写道:“数学家并不是那种能够轻易摆布数字的人,他们常常做不到这点。
数学家的主要技能是擅长在一个高层次上运用符号逻辑,尤其他们有着优秀的直觉判断力。”
在第一次世界大战后,麻省理工学院成为了美国电气工程应用科学的三大孵化中心之一,另两个是贝尔电话实验室和通用电气。
这里也有着对于求解方程的各种迫切需求——尤其是微分方程,又特别是二阶微分方程。
微分方程表示的是变化率,见于如弹道轨迹和振荡电路的分析。
而二阶微分方程表示的是变化率的变化率,例如从位移到速度,再到加速度。
它们很少能求得解析解,却又无处不在。
布什设计的机械正是用来解决此类难题,进而处理产生此类难题的各种物理系统。
与巴贝奇的机器相似,微分分析机在本质上仍然是机械的,尽管它使用了电动 马达来驱动沉重的部件,并且随着逐渐完善,也越来越多地使用了机电 开关用于控制。
不同于巴贝奇的机器,微分分析机并不操作数。
它操作的是量,输出的则是一族曲线,用布什的话来说,这些曲线表示了一个动力系统的未来状态。
现在我们会说这部机器是模拟的,而非数字的,其盘–轮式 积分器是微分方程的物理模拟。
在某种意义上,它是求积仪的后裔,只不过体积大了许多。
所谓求积仪,是一种小型的测量装置,能把曲线的 积分转化成轮子的运动。
不论如何,教授和学生们还是蜂拥而来,希望求得微分分析机一用。
而当它能够以百分之二的精度求解方程时,作为操作员的克劳德·香农就已经很满足了。
他被这部“计算机”彻底迷倒了,不只由于那些旋转不止、喳喳作响、占满了一整个房间的模拟部件,也由于那些几乎默不作声(除了偶尔咔嚓作响一下)的电动控制器。

里面的控制器分为两种:普通的开关,以及特殊的开关——继电器,这是电报中继器概念的衍生物。
所谓继电器,是由电控制的电动开关(似乎有点同义反复)。
在电报中使用中继器,是为了通过逐站传递使信号实现远距离传输。
而对于香农来说,继电器的意义不在于延展距离,而在于进行控制。一百个继电器,在以复杂的方式连接起来后,以特定的顺序通与断,就能协调微分分析机的运作。
在复杂继电电路方面最好的专家就是电话工程师。
继电器控制着进入电话交换机的通话的路由,它们也控制着工厂装配线的机械。
对于各种具体情形,人们设计了不同的继电电路。
不过,从没有人想到要系统地对此加以研究。
当时正为自己的硕士学位论文找题目的香农,意识到这其中有文章可做。
在大学的最后一年,他上过一门符号逻辑课程。
而现在当他试着把众多开关电路的可能组合整理成表时,他突然有了一种似曾相识的感觉。
在高度抽象的层次上,两者有相通之处。
符号逻辑的古怪记法——布尔“代 数”,应该可以用来描述电路。

这是种奇异的结合,毕竟电和逻辑看上去似乎风马牛不相及。
然而,正如香农所认识到的,继电器从一个电路向下一个电路所传递的,并不是真的电,而是一个事实,即这个电路是闭合还是断开的事实。
如果这个电路是断开的,那么继电器可能会导致下一个电路断开。
当然,反过来也是可能的:当这个电路是断开时,继电器可能会导致下一个电路闭合。用文字描述开关电路的种种可能性太过啰唆,简化成符号就会更简洁,也便于数学家在表达式中对符号加以操作。
查尔斯·巴贝奇 的机械记法已经迈出了相同的一步,不过香农对此一无所知。
“一种演算法已经被发展了出来,借此可以通过简单的数学过程来推导这些表达式。”
香农在他1937年的硕士论文中以这样响亮的宣言作为开篇。
任何电路都可以由一套表达式来表示,然后在其中运用演算法,而“这种演算法被证明类似于符号逻辑中所用的命题演算”。
一如 布尔,香农也表明他的表达式里只需两个数:0和1。0代表闭合电路,1 代表断开电路;开或关,是或否,真或假。
香农接下去进行了进一步的探讨。
他从简单的情形开始,分析带有双开关的电路,也就是将双开关 串联或并联的电路。
他注意到,串联电路对应逻辑联结词与,而并联电路则具有或的效果。
逻辑运算否(即将一个值转化为其反面)也可以用电路实现。
他还发现,电路可以像在逻辑学中一样,作出“如果……那 么……”的选择。
他进而分析了更为复杂的“星形”和“网状”网络,所用的方法是提出一系列公理和定理,以此推导联立的表达式。
在经过层层递进的抽象讨论之后,他最后举了一些应用例子——这些例子是虚构的,有些十分实用,而有些则十足古怪。
比如,他绘制了一个具有五个按钮开关的电气密码锁的电路图。
他还设计了一个电路,“只使用继电 器和开关,就能实现对两数自动求和”。
不过为了方便起见,他的例子 只是基于二进制。
他写道:“使用继电电路进行复杂的数学运算是可能的。
事实上,任何可以用如果、或、与等字词在有限步内加以完整描述的操作,都可以用继电器自动完成。”
总之,这样的题目在电气工程学的学生中是前所未见的,当时典型的论文题目通常是如改进电动马达或传输线路等。
当时尚未有对于一种能解决逻辑难题的机器的应用需求,
但它是面向了未来。
逻辑电路,二进制算术。
这篇出自一个研究助理的硕士论文,蕴涵着即将到来的计算机革命的核心。
以上想法是香农1937年夏在贝尔电话实验室实习时成形的。
之后他回到了麻省理工学院,并在万内瓦尔·布什的建议下,从电气工程系转 到了数学系。
布什还建议香农考虑一下是否有可能把一种符号代数(也就是其“奇怪的代数”)应用到新兴的遗传学上。
当时人们对于遗传学的基本要素——基因和染色体,理解还相当模糊。
香农于是开始以此为题撰写一篇雄心勃勃的博士论文,也就是后来的《理论遗传学的代数》。
他指出,基因是一种理论构造。
它们通常被认为存在于被称为染色体的丝状物上,后者可以在显微镜下看到,但人们无法确切了解基因是如何组织的,甚至无法确定它们是否真实存在。
不过,香农指出:“尽管如此,就我们的讨论而言,是可以把遗传理论看作成立的……因而我们在接下去的讨论中,将假设基因是真实存在的,而我们 对于遗传现象的简化表示也是对的,因为在我们看来,事实可能就是如此。”
他设计了一种表示方法,用字母和数字来表达个体的“基因分子式”。
比如,一个个体的两对染色体(每个染色体上有四个基因)可能会是这样的:

\[A_1B_1C_3D_5 E_4F_1G_6H_1 \]

\[A_3B_1C_4D_3 E_4F_2G_6H_2 \]

接下去,基因组合和杂交过程就可以通过一种带有加法和乘法的演 算法加以预测。
这就像某种抽象的道路图,已经远远脱离了纷繁芜杂的生物学现实。
对此,他解释道:“对于那些非数学专业的人,我们希望 指出,在现代代数中使用符号来表示概念而不是数字,是种常见做法。”
这种做法复杂而富有新意,与当时该领域的常见做法大不相同。

可惜的是,他并未公开发表这篇论文。
四十年后,遗传学家詹姆斯·富兰克林·克罗 (JamesF.Crow)对此评价道:
“这篇论文似乎是在与群体遗传学界完全脱离的情形下独立写出来的……
香农发现的原理,后来被别人再度发现……
我所惋惜的是,它没有在1940年就广为人知。
我以为,它本可能彻底改变这门学科的轨迹。”

与此同时,在1939年年初,他在写给布什的一封长信中谈到了一个自觉更为重要的想法:
时断时续地,我一直在研究传递信息的一般系统的某些基本属性,它们包括电话、无线电广播、电视和电报等。
几乎所有的通信系统都可以归结为如下的一般形式:

其中T和R分别代表发送方和接收方,它们隔开了三个“时间函数”, f t :“待传输的信息”、信号,以及最终输出。
当然,最终输出希望做 到与输入等同或接近等同。
(“在理想的系统中,最终输出将是输入的 精确复制。”)
但香农也认识到,问题在于真实的系统总是会经受失真 (distortion)——对于这个术语,他计划给出一个数学形式的严格定义。
同样地,真实的系统中还存在噪声(“例如静电”)。
香农告诉布什,他正试图证明一些定理。
同时,并不意外地,他也在忙于构造一种机器,它完全借助电路就能实现各种符号化的数学运算,从而替代微分 分析机的工作,甚至还能做更多。
但他面前的工作任重而道远。
他说:“尽管我已经在问题的一些外围部分取得了些许进展,但要说到取 得实质性结果,我仍然进展缓慢。”
我绘制了一组电路,它们确实可以针对大部分函数进行符号微积分计算,但所用的计算方法不够通用或自然,并不能令人完全满意。
我恐怕是完全没有把握到这种机器所应遵循的某些一般原理。
这时的香农瘦到了简直是皮包骨的程度,耳朵从剪得短短的鬈发下也仅能露出一点。
1939年秋的一天,他在与两位室友同住的花园街公寓里举办了一场聚会。
他羞涩地站在自己房间的门口,听着留声机播放的爵士乐,突然一个年轻女子开始向他扔爆米花。
她就是诺尔玛·莱沃(Norma Levor),一个来自纽约的大胆姑娘,时年十九岁,曾就读于 拉德克利夫学院。
那年夏天,她弃学前往巴黎,但纳粹德国入侵波兰后,她被父母接回了老家。
然而即便在家乡,战争阴影也开始笼罩人们的生活。她被克劳德气质中的深沉阴郁以及智力上的才华横溢所深深吸引。
他们开始每天约会。
他为她写十四行诗,模仿E. E.卡明斯(E. E. Cummings)的风格一律小写;
而她则欣赏香农对文字的热爱,喜欢他 说“布——尔代数”的方式。
到了次年一月,他们就结婚了(不过仅在波士顿地方法院登记,并未举行婚礼)。
而后她跟香农一起到了普林斯顿高等研究院,因为在那里香农获得了一个博士后职位。

alt 夫妻
i am test

posted @ 2020-05-10 22:15  杨孝乾  阅读(1904)  评论(0编辑  收藏  举报