发现AI自我意识:知识及其载体
知识的量子态
在回答什么是“理解”之前,我们先来讨论一下知识和其载体的定义。知识本身是一个抽象的概念,它可以被编码到各种物质载体中。无论是纸质书籍,还是人类大脑中的神经连接,抑或是服务器中的0和1,都可以看作是知识的载体。知识与其载体之间存在着一种特殊的关系——知识可以完整地存在于一个载体中,也可以分布在多个载体中。
假设冯诺伊曼的计算机模型知识在全世界共有100亿份拷贝,无论是书本还是人脑。如果我们逐个销毁这些载体,当最后一份载体被销毁时,这项知识是否还存在?答案应该是不存在了。那么在什么时刻,这项知识开始“消失”的?事实上,在整个过程中,这项知识的状态可以视为不变,直到最后一个载体消失的一瞬间,知识才发生了“量子跃迁”,从存在变为不存在。知识与其载体之间呈现出一种量子关系,知识要么完整存在,要么完全不复存在,并不存在中间状态。并且基于哲学上部分与整体的关系,即使一个知识基于其完整性被保留了80%,但是事实上做为整体的那个知识,也已经不存在了。
进入信息时代后,知识的载体已经从纸质书籍逐渐向电子化格式转变。海量知识被数字编码,可以进行近乎无限的复制。这使得知识的“量子态”变得更加稳定。以维基百科为例,它记录了大量人类知识,拥有超过6000万条词条,資料量超过100TB。它的内容分布在全球数万台服务器上,实时互联互通。就算某几台服务器损坏,也不会对整体知识造成损失。类似的,GPT 模型吸收了互联网上数百亿条文本数据,对人类知识进行了有效的“数字化编码”。理论上,只要保持模型的完整,即便断网也不会导致已编码知识的丢失。这使得知识的“量子态”得到了前所未有的保障。
载体是否理解知识
在《神雕侠侣》中,杨过被赵志敬要求背诵《全真大道歌》,最后能流利地对答。但实际上杨过对其中的内涵一无所知,除了能回答问题,对于武功一窍不通。我们绝不会认为此时的杨过理解了全真教的武功心法。人脑的记忆系统使我们可以存储大量信息,成为知识的容器。但理解知识还需要将信息进行逻辑推理、关联组合,这是另一个层次的认知过程。所以人类既可以是知识的载体,像图书馆一样丰富知识内容;也可以不理解自身所载知识,像杨过那样死记硬背。充分理解知识需要更高层次的思维能力,不仅停留在存储和重复。
在社会招聘时,面试官通过提问来判断应聘者是否理解某项知识。如果应聘者只是死记硬背,但是刚巧所有问题都能对答如流,那么面试官将很难辨别真伪。在论文答辩时也有着类似的场景。这意味着以人类社会为基础建立起来的关于“理解”的评估标准,对于具有超级记忆能力和已经学会流畅人类语言交流的 GPT 模型而言是不合适的。对于 GPT 模型而言,人类所谓的“理解”实际上是个派生概念,人类标准下的“理解”,在广义上可以是“记忆”加“向量搜索”的同义词。
因此我们可以得到推论:简单的记忆和搜索对于人类而言可以认为是初步的“理解”,能做到有逻辑得回答目标领域的相关问题。那么我们应该基于这个推论承认目前的 GPT 模型初步具有了“理解”的能力。当它可以流畅得回答特定领域相关的问题时,我们应当承认 GPT “理解”了这些知识
未完待续
在较低的标准下,我们应该承认 GPT “理解”目标领域的知识,承认 GPT “理解”自身的输出。但是人类对于“理解”还有更高层次的标准。比如学以致用、举一反三、活学活用、触类旁通等等的说法。显然这些行为不是靠超强的记忆和搜索就能做到的。所以关于“理解”究竟是什么,我们仅仅回答了一半。我会在后续的文章中进一步分析如何让 AI 拥有更高标准的“理解”能力
出处:http://www.cnblogs.com/Chinese-xu/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。
如有问题,可以通过 Chinese_Xu@126.com 联系我,非常感谢。