集异璧

巴赫,艾舍尔,哥德尔

巴赫是卡农创作的大师。卡农的基本特点是一个单一的主题与它自己相伴而奏,由加入的各个声部分别唱出主题的副本,这些副本包括主题在音高上的平移, 时长上的拉伸与收缩,镜像,逆行等。但是无论是哪种副本,它都保持有与原主题完全相同的信息,也即从每个副本中都有足够的信息可以恢复出原主题。这种保存信息的转化称为“同构”。对于大部分的主题来说,这样的演奏是无法达到和谐的,因为卡农主题中的每个音符都同时扮演者两个甚至三四个角色,即每个音符既是旋律的一部分又是同一旋律在特定时刻的该音符的和声。通过选择特定的主题和特定的时间间隔来创作卡农(以及其它复调作品)的方法就是“对位法”。《音乐的奉献》是能代表巴赫在对位法方面最高成就的作品之一,在这里每一种使卡农复杂化的手法都被充分使用了,是人类智能的优美绝伦的创作。其中有一首极不寻常的卡农,它的主题在每一次结束时会悄然升高一个调(某种听觉错觉),然后重复自身,给人一种“无穷升高”的感觉。在这里我们发现了第一个有关“怪圈”的例子:当我们向上(或向下)穿过“某种层次系统”(这里的系统就是音乐的调性)中的一些层次时,会意外地发现我们正好回到了我们开始的地方。image-20230625173158444

把“怪圈”概念最优美最强烈地视觉化了的人是艾舍尔。在《瀑布》这幅作品中,有一个六步无终止下降圈。这样的视觉错觉最早是由罗杰·潘罗斯发现的,正是成为了游戏《纪念碑谷》的核心。同时我们发现,层次的数量在这里开始变得模糊,不像我们能在巴赫的音乐中数出主题的出现次数,一幅画中的层次数量有时是不容易确定的。艾舍尔的作品中有的怪圈显得“紧凑”,有的显得“松散”。在这样的错觉中,有的显得更“实在”,有的更“虚幻”。艾舍尔能够画出几十种半实在半虚幻的世界。在他的其它作品中,怪圈不仅表现在空间高度的视觉错觉上,也可以表现在“一只被画出的手画出了自己的手本身”,以及“一个拿反光球的手”。所谓“怪圈”,其中隐含的是一种无穷的概念:“循环”这一概念通过有穷的方式描述了无穷的过程。

image-20230625174545993

巴赫和艾舍尔的怪圈作用于人们简单而古老的直观(音阶和楼梯)中,产生了有穷与无穷的冲突,使人有一种强烈的悖论感。我们直觉到这里涉及到了什么数学问题。哥德尔发现了这一直观在数学上的根源:说谎者悖论。小明说:“我在说谎”,问小明有没有说谎?如果他说谎了,那么他就没说谎;如果他没说谎,那么他就说谎了。这意味着,存在这样一个陈述,既不为真也不为假。这样一句话——“我在说谎”——的存在粗暴地违反了通常设定的“把陈述分为真与假”的二分法,它是一个仅仅只有一层的“怪圈”。这里的关键是,这句话陈述的对象是它自身,我们称之为“自指”。在日常生活中这样做通常是没有问题的,这缘于自然语言的模糊性。但当我们把这样的自指应用到数学(数论)上就会出现问题。当哥德尔有了这样的直觉以后,他构造出了一个自指的数学陈述,从而证明了著名的哥德尔不完全性定理:数论的所有一致的公理化形式系统都包含有不可判定的命题。哥德尔的构造的核心在于“编码”——只要数能够用来代表陈述,那么一个数论陈述就可以使关于一个数论陈述的了,因此也就可以是关于它本身的。只是哥德尔运用的陈述并不是“本句话是假的”,而是“本数论陈述是不可证的”。这里涉及到了“证明”的概念,一个陈述以及它的证明是存在于某个“公理系统”当中的。一个完美的公理系统应当满足:从公理出发推出的定理不能自相矛盾,这称为一致性;每个陈述都是可以从公理出发给出证明的,这称为完全性。哥德尔定理正是指出了如果一致性已经满足,那么完全性就不能同时满足:存在有一致的公理系统中的真的陈述,我们一定无法找到这个陈述的证明,因为我们将会像说谎者悖论一样发现“如果可证,那么它不可证;如果不可证,那么它可证”。可证性总是比真理性更弱的概念。反过来如果每个陈述都能被证明,这个系统就一定不一致,也就一定会出现自相矛盾的陈述。这颠覆了人们对公理系统的认识,是一场如相对论和量子力学一样的革命。我们今天或许不再对此感到惊讶,那只是由于我们的文化在经历了这一百年已经把这些观念潜移默化地吸收在内了。

说谎者悖论本质上可以用集合论的语言来表述:一个集合要么是不包含自身的(称为普通的),要么是包含自身的(称为自吞的),现在问一个由所有普通集合构成的集合是普通的还是自吞的?如果它是普通的,那么它作为普通集合当然被包括在内,因此是自吞的;如果它是自吞的,那么他有一个元素是它自己,而我们知道这个集合内的元素全都是普通集合,所以它是普通的。所以问题在于,我们对于“集合”的直观概念出问题了,这样的概念在数学上是不被允许的。但是概念不可能脱离直观,我们想要构造绕过悖论的但又与我们的直观相符的严格的集合论。

如果直接取缔自指以及一切允许产生的东西,是不是问题就解决了?这其实不容易,因为断定自指出现在什么地方是困难的。一个怪圈有可能要通过好几个分立的步骤才完全显示出来,例如把说谎者悖论扩展成两句话:“下一句话是假的”与“上一句话是真的”,那么这两句话中的任何一句单独拿出来都不构成悖论,只有当它们连在一起时悖论才会出现:如果第一句为真则第二句为假,而第二句为假又反过来推出第一句为假,矛盾;如果第一句为假则第二句为真,第二局为真又推出第一句为真。综上第一句话的真假性无法判定,第二句也是同理。就好像艾舍尔的画里每个局部都没有显示出问题,只有当整幅画一起看时才会出现矛盾。如果要取消自指,不仅要取消直接的自指,还必须取消所有像这样间接的自指,而这样的自指可能分布在文章的各个角落。在集合论中人们创造了“类型论”,确实消除了怪圈:我们要求最底层的集合只能包括对象而不能包括集合,高一层的集合只能包含低层级的集合,这样刚才提到的“包含所有普通集合的集合”就不再是一个合法的集合了。但这样的概念首先是不符合直观的,因为我们直观上不会给集合“分层”,当我们陷入一个“丑陋的理论”时往往说明哪里出了毛病。其次,把“类型论”应用到自然语言中将会是灾难性的,因为那样我们将无权讨论“我”,无权讨论这一理论本身,许多完美无缺的语言构造都将被视为“没有意义”。

哥德尔定理的出现是“把推理思维机械化”过程中的很大障碍,因为现在人们发现推理似乎不能简单地与公理系统等价了。极不灵活的无生命的机器逻辑与灵活富有生机的思维,似乎是矛盾的。但这种矛盾只是表面上的!谁也不知道非智能行为和智能行为之间的界限在哪里,或许认为这种界限存在本身就是愚蠢的。人工智能工作的奇异之处就是试图将一长串严格形式化的规则放在一起来产生灵活的效果。智能的灵活性来自大量的不同规则和规则的层次,因此那些直接或间接的“怪圈”无疑是智能的核心。

“对我来说,哥德尔、艾舍尔、巴赫只是某个奇妙的统一体在不同方向上的投影。我设法把把哥德尔、艾舍尔、巴赫这三块稀世珍宝嵌为一体,集异璧之大成。”

形式系统

为了理解什么是形式系统,我们来举个例子,这个例子叫“WJU系统”。WJU系统由一系列字符串构成,其中字符只能取W、J、U三种。一个合法的字符串要满足以下规则:1. 如果某个合法字符串的结尾是J,那么在后面加上一个U依然合法;2. 如果Wx合法,那么Wxx也合法(其中x代表任意长度的某个字符串)。3. 可以用U代替JJJ。4. UU可以消去。现在我们已知WJ合法,问WU是否合法。

在上面这个问题中,每个合法的串就是一个“定理”。其中WJ这个定理是已知一定合法的,称为“公理”。那四条规则称为“推理规则”。我们可以从公理出发做“推导”:WJ\(\to\)WJJ\(\to\)WJJJJ\(\to\)WJJJJU\(\to\)WUJU\(\to\)WUJUUJU\(\to\)WUJJU。这样我们就给出了“定理”WUJJU的一个“证明”。

我们可以从公理出发让计算机开始搜索,如果时间足够长,我们总能用这种方式找出所有的定理。但人的智能并不完全是通过搜索来起作用的。人脑在思考这个问题时,一般首先会推出一部分定理,然后“看一看它们是什么”。一段时间之后,我们会注意到所有定理都是W开头的。这个模式浮现在脑海中,我们不仅能看出这个模式,还可以通过检查那些规则来“理解”这个模式。我们称它为这些规则产生的一个“性质”,即新产生的定理一定继承原先那个定理的首字母。因此人脑很快就会发现证明“U”是不可能的, 但刚才的暴力搜索的计算机程序却无法发现这一点。计算机不具有“观察”能力,这可以看作机器的一种特征。当然,计算机可以被制造成具有某种观察能力,但人通常不可能不去观察,人是天生具有观察能力的。这里的观察能力指的就是跳出正在进行的工作本身——跳出系统——看一下已经做了些什么的能力。这是“智能”固有的特点。

但人类智能不足以找到所有判定一个定理是否成立的“性质”。无论是人还是计算机,最首要的问题是要找到一个判定过程:如何在有限长的时间内判断一个有限长的符号串是否是一个定理。由于符号串的长度可以无限延长,我们的搜索程序永远不会停下来,因此这个搜索程序无法成为一个判定过程。如果有了一个判定过程,我们就有了系统中所有定理的一个非常具体的“刻划”。注意“刻划”这个词,我们总会认为“公理+推到规则”确实已经隐含地刻划了所有的定理,但这种刻划无法帮助我们判定任意的符号串是否是定理——因为仅仅依靠它们我们可能需要无穷的时间来得到结果!换言之,这种刻划是很“弱”的。而一个判定过程是一个相对较“强”的刻划。

再考虑另一个形式系统,它由q,p,-构成。如果x由若干-构成,那么x-qxp-是一条公理。推到规则只有一个:可以由xqypz推出x-qypz-,其中x,y,z是任意的只包含-的串。经过简单的尝试和思考,我们发现这个形式系统其实“很像加法”。q代表equal,p代表plus,-的数量就是数字的大小。(比如-----q---p--就是一个定理,而-----q--p--就一定不是一个定理。)是什么东西使我们产生了这样的想法呢?我们的回答是:我们在qp串与加法之间“看到了同构”。“同构”这个词的定义是:保存了信息的变换,也即两个复杂结构可以相互映射,并且每一个结构的每一部分在另一个结构中都有相应的部分。其中“相应”指的是在各自的结构中相应的两个部分起着相类似的作用。我们甚至可以说,是对于同构的认识在人们的头脑中创造了“意义”的概念——同构产生意义!把q对应成等号,把p对应成加号,把短杠对应成数字,我们就给出了字符串的一种“解释”。当我们给符号“赋予一种解释”时,符号串就产生了“意义”。对于一个给定的“符号串”(广义上说,在我们面前的任何东西,任何“现象”),我们赋予它“意义”的唯一方式就是在知识的基础上进行猜想和试错,建立一种同构关系。如果我们不把q,p解释成等号和加法当然也是可以的,“解释”可以是任意的。但有意义的解释必然是同构于现实的某一部分的。

一个形式系统的意义不是唯一的。如果把q理解为减号,p理解为等号,那么以上系统的意义就变成了“减法”,而它恰好也是成立的。一个形式系统可以与现实中的不止一个方面彼此同构。

形式系统的意义与日常语言的意义会有所不同。在日常语言中一旦我们掌握了某种新的意义,我们就能够用它造出新的句子,因为它为创造句子带来了新的规则。但在形式系统中意义的出现只是一种“解释”,它并不会产生出新的定理。例如,即便“理解”了p,q是等号和加号,------q--p--p--也依旧不是一个定理,尽管“人”总是“希望”这是一个定理。形式系统的意义是被动的,而我们(智能)一般所理解的意义是主动的。

人们很自然地想知道,现实的哪一部分可以用一组支配无意义符号的形式规则来加以模仿(即同构)?现实世界的一切都可以变为形式系统吗?人们或许会设想,整个宇宙其实就是一个宏大的形式系统,物质的可分性有尽头,尽头的基本粒子就是系统的对象,而这些对象的存在受到宇宙基本定律(公理)的支配。当然,由于我们对宇宙的了解不够充分,这还是个尚未解决的问题。

数论

我们不去讨论宇宙这么大的图景,而只以数论这一形式系统做为我们的现实世界。我们建立数论(研究整数)这样一个形式系统是为了获得对于“世界”的新的认识。这种认识只是我们的猜测,要想检验我们的形式系统是否与世界完全同构是一个无穷的工作,因此是不可完成的。我们并不能确定我们的公理是否是正确的。然而人们在长期的历史生活中总结出了最基本的数的规律,诸如加法交换律、乘法分配律等等。这些规则构成了算术,并进一步构成了数论。

因此当我们应用数论时,首先要把现实中实际的事物转变成作为形式事物的“数”。一个关键问题是,要把所有数论装进一个理想的系统是否真的有可能做到(艾舍尔的《释放》描绘了这一点)?数论中的一些陈述甚至不是“计数”能够解决的。例如,要证明“素数有无穷多个。”欧几里得给出了它的证明,因为对于任意的正整数\(n\)\(n!+1\)都不能被\(1\)\(n\)中的任何一个数除尽(都余1),所以要么\(n!+1\)本身是一个素数,要么它有一个素因子\(k\),我们证明了\(k>n\)。也即我们证明了任意给一个\(n\),一定存在一个大于\(n\)的素数。所以素数有无穷多个。这样的证明是“真正的数学”,它简洁、优美且令人信服。同时,这个证明的每一个陈述都以一种不可抗拒的方式与前一个陈述有联系。存在这种滴水不漏的联系在一起的步骤,这一事实本身就暗示着可能存在一个具有模式的结构把这些陈述连在一起了。

特别重要的一点是,我们用有限的语言证明了“无穷”这一事实。原因在于我们用了“所有”这个词。我们发现似乎可以通过一些很简短的步骤从起点走出很远。我们之所以可以通过使用“所有”来讨论无穷,在于我们认为我们理解“所有”这个词的意义。但这只是我们的思维运转过程做出的一种“归因”,事实上发生的事是,我们在使用这个词的时候必须遵守一些规则,我们或许没有认识到这些规则。如果我们越来越仔细地看这一证明,会发现它其实是由许许多多几乎“无穷小”的步骤组成的,它复杂到难以置信。对于人脑来说,把许多步骤压缩成一个句子来表达是最清晰的,但如果观察这一思考过程中人的脑细胞,它可能被激活了几百万次。因此这一证明实际上确实是极其复杂的。假如说大自然中“素数有无穷多个”这一证明有一个确定的“复杂性”,则这个复杂性的大小应当和神经元的激活次数有相同的数量级,而不是表面上看上去的“三言两语”。

我们也想用形式系统来刻划素数与合数。但这里我们发现了素数与合数是有区别的:我们可以类似地定义一个tq系统来刻划乘法,比如------q--t---。那么对于这个系统中的任何一个xqytz,我们就可以判定x是合数。也即我们可以定义形式系统规定Cx,只有当x出现在某个xqytz中时为真。我们自然地想到判定素数只需要Cx为假,但这是难做到的——我们已经看到想要在有限的时间内判定一个形式系统的定理为假需要跳出系统Cx,因此这不是形式系统Cx本身就能做到的!素数与合数让人想起艺术中的“图形”与“衬底”之分,当我们画上一个形状时,就不可避免地画上了与它互补地形状。艾舍尔地《以鸟为瓦》就是同时利用图形和衬底来作画的代表。音乐中的“旋律”和“伴奏”也与此有相似之处,巴赫的音乐就是同时用这两者来创作的。但我们的直觉一定认为能刻划图形,不可能无法刻划衬底。这个直观背后的支撑是:图形和衬底带有的“信息”是完全相同的。这一点正确吗?答案是我们的直觉错了。数学家发现了这样一个事实:存在一个形式系统,其负空间不是任何一个形式系统的正空间。这个定理与哥德尔定理具有同样的深度,它导致的结果是存在这样的形式系统,它不存在有限的判定过程,因为必须要“穷尽”了无穷的正空间才能够得到正空间。对应在艺术上:并不是所有图形的衬底都有意义。问题出在了无穷上,我们给一个无穷的集合去掉某个子集而产生的洞是很难用什么显明的方式来定义的。而幸运的是,对于素数我们是存在形式系统来判定的。这缘于数的序结构——如果我们通过从小到大的顺序来枚举,那么在处理每个数的时候我们的步骤都是有限的,不必担忧经过无穷的时间后再次回到这里,这个方法就是我们熟悉的素数“筛法”。然而对于一般的形式系统,它会包含任意多的向前向后的干扰,所以才导致了诸如哥德尔定理、停机问题、负空间非形式系统等等问题。

几何学

意义产生于形式符号与现实世界的同构,这个同构越简单则我们认为这个意义越显明。一个常犯的错误是,我们常常把意义归于词本身,而没有意识到词与现实的同构本身是极其复杂的。就好像把碰撞的声音归因于碰撞本身而忽略了介质的存在。

几何学就遇到了这个问题。欧几里得的《几何原本》中所有的定理都建立在五条公理上,但用来建构证明的东西是人类语言——一种充满隐患的复杂又难以捉摸的通讯媒介。欧几里得没有给出“点”、“直线”等等最基本的词汇的“意义(定义)”,这些日常用词的使用不可避免地造成了一些意象不知不觉潜入了证明当中。欧几里得本人应该也感觉到《几何原本》中的第五条公理“平行公设”似乎是可以由前四条公设证明出来的,但许多人花费了无数光阴都没能找到证明。所有曾经给出的“证明”都由于日常直观与严格形式化的混淆而被证明是错误的了。

人们发现的一个新颖的角度是,把第五公设的错误作为新的公设开始推导,看是否能找到矛盾。这就是非欧几何学的诞生。这里发生的关键的事是:新公理的出现导致了原先的“意义”——点、直线的定义——发生了全新的变化。如果认为不存在平行直线,得到的是椭圆几何学,其中点的意义变成了“球面上某个直径的两个端点”,直线的意义变成了以球心为圆心球的半径为半径的圆;如果认为存在不止一条平行直线,得到的是双曲几何学,点、直线的意义相应地也与日常经验不同。人对意义的把握实际上是取决于公理的!比如在原本的pq系统中,我们已经有--q-p-这一公理,在这时q的意义是“等于”。如果强行加入-q-p-这一公理,原先“等于”这一意义就彻底崩塌了。但如果我们把q解释为“小于等于”,我们就再次获得了一致性。在非欧几何中发生的正是这种由于公理变化导致的“意义变化”。所以我们把几何学中的“点”、“直线”等概念成为“未定义项”,它们的定义隐含于公设之中。所以如果要把几何学完全形式化,需要把每个词都看作是未定义项。每个词都变成了“没有意义”的符号,也就是我们只能留下被动意义而必须抹去我们先行赋予它的主动意义。

当我们认为我们的解释“合理”时,我们其实使用的就是“一致性”这一观念。它定义为:内部一致性,定理之间不自相矛盾;外部一致性,每个定理都能与现实世界同构。我们刚才看到了一致性的破坏,但通过新解释我们又重新获得了一致性。这说明一致性不只是形式系统的性质,还依赖于“解释”——人们主观的选择。内部和外部都是如此,不同的解释会影响系统内部是否自相矛盾,也会影响是否与现实世界同构。内部一致性与外部一致性有密切的关系……

posted @ 2023-06-25 20:47  DennyQi  阅读(177)  评论(0编辑  收藏  举报