【译】为什么AI难以概念化时间
原作:FNTGAI
引言:如何弥合AI与先验概念之间的鸿沟
时间不是你能看到、听到或触摸到的东西。这就是康德所说的“先验”,意味着它在感官中没有对应物。你无法给时间贴标签或分类。这使得AI很难建立时间概念。例如,考虑一下当您询问 ChatGPT 您与它交谈了多长时间时会发生什么:
尽管对计算机来说,读取时间是一项微不足道的任务,但模型在回答这些问题时遇到了困难。原因是聊天记录中没有任何内容表明对话是多久前开始的。大型语言模型(LLMs)本质上在提示之间处于“停电”状态,并在下一个问题时恢复。他们不是对周围发生的事情有持续记忆的生物,例如日出的记忆、课程安排、吃晚餐等。
这个问题在一定程度上是可以解决的。LLM可以有一个自定义例程,该例程将询问内部时钟时间的提示定向到内部时钟,对与相关文本关联的时间戳执行计算。虽然这听起来很简单,但它尚未被引入 ChatGPT 是有原因的。它要求人工智能意识到你正在询问“实时”,而不是关于时间的假设性问题,这样它就知道要在文本之外查看元数据。
此例程的任何实现都需要额外的数据工程以及手动的对话“标记”,例如标记: <对话从这里开始>。
相比之下,人类没有这样的内置标记。相反,你的大脑会根据你的记忆内容来计算时间的流逝。你能做到这一点是因为与LLMs不同,你经历着连续的生活。你的经验和记忆是自主驱动的——例如,你吃早餐是因为你饿了,而不是因为有人提示你。当你出于某种原因需要决定时间时,你有一套技能可以帮助你从思绪中选择相关的记忆。您还学会了如何在已知时间的记忆中逻辑地排列这些内容,例如您听到的上课铃,或看表,甚至是由于睡眠-觉醒周期而感到的疲倦感。由于你缺乏以小时和分钟测量时间的标准内部时钟,你必须求助于间接证据,并利用你拥有的知识和技能来将其组合起来。
处理时间是一项主动的努力,取决于你想要进行的程度。为什么你这样做以及为什么你应该正确地做这件事背后必须有一些动机——例如社会压力、经济激励等。你越关心,你可能会投入越多的努力。当你收集更多的事实、交叉引用事件并纠正你的早期猜测时,你的结论会变得更加准确。
你的大脑中没有子程序可以自动维护从你出生之日起的时间顺序记录,并检查以确保你的所有记忆都按正确的顺序排列;这一切都需要你自己去弄清楚。默认情况下,人类对时间的所有体验都是非线性的。因此,人们经常做梦时回到小学,或者与已故亲戚交谈,却没有注意到时间上的不一致。即使在清醒状态下,错误的记忆也可能会进入你的心灵并混淆你的历史。确保你线性地体验时间实际上需要付出努力;这是你必须积极为自己创造的东西。
另一方面,无实体的 LLM 别无选择,只能依赖内部时钟以及与每行文本关联的时间戳。虽然这听起来好像改进了我们自己杂乱无章的计算方式,但依赖一个线性、精确和绝对的内部时钟实际上限制过多。以一种灵活、模糊和可修订的方式构想时间是有益的。例如,你可以发明非常规的时间公式,如时间膨胀和时间倒流。你可以对时间产生丰富、深刻和可塑性的理解,超越固定时间记录器能给予你的任何东西。你不仅仅是遵循时间——任何计算机都可以做到这一点——你还可以建立一个主观的时间概念。
事实上,你可以用英语单词谈论“时间”,这意味着你已经学会将时间的先验现实与你自己对其的意识抽象联系起来。你可以以最宽泛的意义上感知时间,就像你可以感知存在或因果关系一样。你可以像谈论物质一样谈论时间。你可以衡量拥有时间的价值,并努力获得更多时间(例如更长的生命)。你可以注意到自己在准确测量时间方面的局限性,并发明更可靠的计时器,例如沙漏或原子钟。你可以意识到时间的某些有趣特征,比如当你玩得开心时时间飞逝,并且时间无法倒退。您甚至可以将时间拟人化,例如“时间之父”、“时间站在我这边”。
所有这一切都超出了任何机器人都可以做到的简单的在时间内工作的范围。 你正在提取你的经历的各个方面,并将它们连接到一个被命名的标识符:“时间”。 你能够做到这一点实际上是一件很奇妙但很少被讨论的事情。 反过来,这引发了一些令人困惑的问题。 如果时间确实是某种内在的“感觉”,那么当你感知时间时,你到底在感知什么——它是时间的一般概念、时间中的特定时刻、两次时间的差异、相对时间等等? 你又如何将其转化为可以用于解决与时间相关的问题的格式? 本文将尽力回答这些问题。在此过程中,它将挑战一些关于感知如何运作的常见假设。
理解是通过试错而发展的
时间是数千个难以形式化定义的抽象概念之一。其他概念(至少是那些我们有词语形容的)包括空间、条件、相似、意识、存在、形状、自然、物体、心智、不好、公正、颜色、美丽等。在这些概念中,还存在着微妙的含义差异,比如通常、平凡和规律之间的区别。
没有人生来就知道这些英语单词。因此,必须有一个学习过程,以某种方式将你的经历与它们联系起来。不幸的是,找不到任何一致或明显的感官体验与它们相关联——例如,你将"存在"与哪种感觉联系起来?它们的意义必须以某种方式从你自己的头脑中自发产生,而不是从外部世界经验中获得。这解释了为什么美感和意识等概念是主观的,也解释了为什么你甚至可以理解并使用许多这些单词,而不必能够清楚地定义它们(例如,你如何定义"意识"?)这表明它们可能是先天的或硬编码到大脑中的。然而,许多像软件、后现代主义等抽象概念显然不是与生俱来的。那么,如果它们不是先天的,也不是经验性的,那么这些概念从何而来?
在本文的其余部分,我们将概述一个基于前文讨论的方法的答案。具体而言,我们将展示广义抽象源于个人解决问题的努力。
破解抽象之谜的第一步是注意到人们可以在不理解任务所涉及的概念的情况下成功地完成任务。例如,一个孩子可以参与购买或出售,但没有意识到他正在使用的代币是一个更广泛的概念(称为货币)的实例。他可能只被教导如何向特定的供应商提供一组特定的硬币并获得特定的物品作为回报。这对他来说是一个独特的案例,是在固定地点和时间进行的特殊行动。换句话说,他可以在不知道那是钱的情况下成功地使用钱。在语言方面,人们经常仅仅通过直觉和上下文来正确地使用他们不知道含义的单词。例如,在短语"将小麦与糠分离"中,大多数人可能无法说出"糠"是什么,但他们感觉与小麦相比,这是一种较低等级的产品。
这些例子的目的是表明有用的理解可以从概念上分离出来。像货币这样明确定义的概念在一个人的理解中是较晚出现的,并且通常是为了有效的交流而学习。然而,所有早期的学习都限于肤浅、一次性的感官经历,没有背后的概念。我们最初不应该期望更多的深度。随着时间的推移,人们可以从这些有缺陷和虚假的关联中建立起更“正确”和完整的理解,因为人们在与问题领域有效交互或与他人沟通的能力上受到限制。
让我们通过描述孩子们如何探索“奶奶”这个词来看看这个纠错过程的例子。学会这个词的幼儿一开始可能会表现得好像他的祖母是唯一与这个词相关的人。随着他的社交圈子的扩大,当其他人似乎也与这个称谓有关时,他可能暂时感到困惑。孩子将通过特殊修改来调整并学习使用这个词作为两个人的标签——例如“佐伊的奶奶”。他会做出这些修正,因为对他来说,称呼这两位女性为“奶奶”在社会上是有用的,只是方式和语境略有不同。
然而,仅仅因为他在几个不同的情况下使用了这个词,就认为他此时已经概括了“奶奶”的概念还为时过早。如是他知,这两个人只是有一个共同的称呼,就像一个名字一样。很多人叫"Caleb",但没有更深层次的"Caleb"概念需要将他们统一起来。
在分析我们如何学习单词时,一个关键且经常被忽视的考虑因素是孩子最初学习“奶奶”这个词的原因。这通常被淡化为某种形式的统计关联,并与关注相结合。然而,我们在先前的文章中已经讨论过,简单的关联对于在大多数无监督环境下的学习是无效的至于为什么他学会了“奶奶”,真正的答案既简单又明显:孩子喜欢他的奶奶,并且经常想要得到她的帮助和关注。人们很快学会了解决问题的事实或行为。孩子发现,孩子发现“奶奶”这个词——无论是谁说的——都是获得她感情的有用工具。
这个动机很重要;它将塑造他对"奶奶"这个词的学习。例如,当其他孩子用"奶奶"这个词来称呼自己的奶奶时,这个孩子的奶奶不会回应,期待中的亲人也不会出现。因此,驱使他学习这个表达方式的动机将受到挫败。对于孩子所解决的问题,什么才算是“成功”的识别,包括孩子随后做出的任何纠正,取决于他正在解决的问题。
说“奶奶”的效果取决于说这句话的人;这一事实并非适用于所有词语,尤其是对于孩子认为只有一个的东西(例如他的"托儿所")。“奶奶”是相对于说话的人来说的,而这个特性成为了概念中相对性的根源。这样的特性不会被幼儿有意识地认识到——它通过各种行动的成功和失败以及需要学习的特殊情况来影响他。当他开始更抽象地使用“祖母”这个词时,相对论也会发挥作用——例如细胞有丝分裂中的祖母中心粒。
祖母最终是一个抽象的概念。你不能仅仅通过感官关联来学会使用这个词。因此,我们来到了本文的核心,也是在辨认中最大的挑战之一:如何学会识别抽象实体。接下来的内容将重点介绍如何应用本文和之前文章中讨论的工具来建立时间概念。
在我们继续之前,我必须提供一个重要的警告。在一篇文章中不可能解释出人们建立某个概念的所有方法,尤其是像时间这样复杂的概念。它越微妙,你思维中的层次和相互关系就会越多。我们能做的只是提供一组例子,说明特定的辨认行为可能是如何学习的,并从中得出一个普遍规律。
关于“时间”的粗略开始
让我们想象一个从未接触过时间概念的孩子。因此,她对该概念的第一次接触不能依赖于直接辨认时间本身——她的心智中还不存在可识别的概念。她进入这个领域的第一步必然是近似的。它们只会通过以后的修正而变得更加完善,正如我们在上面的“奶奶”的例子中看到的那样。对于一个刚刚开始学习某个主题的人来说,除了最大努力的学习外,我们不能期望他有超出他们已有的知识和技能的更多表现。
例如,婴儿对世界缺乏足够的了解,无法想象父母未来的行为。因此,对于他们而言,被告知“稍后”或“明天”会得到一些东西,或者必须"等待",都与仅仅被告知"不行"没有区别。听到这些词中的任何一个都预示着失望。
一旦婴儿具备足够的想象力来预测他人的行动,并回忆和联系起时间上的事件,她可能会意识到“稍后”通常会得到解决,而"不行"则不会。当被告知她将在"稍后"得到某样东西时,她可能会学到一组充满期待和希望的想法。这些想法现在可以作为对最初失望的一种解决方案:她只需要"等待"。
虽然 "稍后" 和 "不行" 曾经是同义词,但与简单地被告知“不行”相比,“稍后”现在具有一套独特的解决方案。对于"不行",她必须更加有力地争取自己的要求,否则就接受失败。这是她心中两者之间的根本区别——解决问题的方法不同。
随着孩子逐渐长大,并对世界了解得更多,新的问题开始出现,而她在婴儿时期并没有意识到这些问题。有一天,她可能会发现自己很恼火,因为坐在候诊室里,没有做她想做的事情,而且被告知要表现得规矩。我们成年人会认识到这是无聊,但幼儿只是因为被迫静坐而感到恼怒。她并没有察觉到时间被浪费了。
稍后她可能会知道,当时钟显示特定位置时,她可以离开。她不断抬头看着时钟,看到分针离所期望的位置越来越近。最终,她被允许离开。由于时钟只朝一个方向走,在许多类似的情况和等待室中,她可能会学会在想象中预测其位置的变化,并在现实生活中希望它发生(即变成一种意图)。这也不一定是一个时钟,也许这是一个她已经熟记的教堂礼拜仪式。
通过观察和预测时钟的变化,这个女孩为她对时间持续性的理解奠定了基础。我们不需要寻找对持续时间的任何天生的理解来解释女孩如何解决上述问题,因为她只是在观察时钟的运动。相反,顺序是相反的:持续时间首先出现在她遇到的等待问题中。随着时间的推移,她可能会开发出更数学化和更精确的持续时间版本。然而,即使在那时,“持续时间”的“感觉”仍将带有其动机起源的烙印:它植根于她不得不违背自己意愿等待的记忆,或者当她享受的事情结束得太早时的失望。展望未来,她通常只会关心体验的持续时间,当她对活动感到厌倦时,就会开始看时钟;我们成年人并没有太大的不同。
其他动机,其他原因也会出现,要求她间接地解决时间问题。她可能因上课迟到而受到责备。之后,她可能会学会看时钟,注意到如果她的行动与特定的指针位置不一致,就会给她带来问题(准时)。在其他情况下,她可能会学会在两个互斥的活动之间进行选择,这两个活动不能同时参与(排他性)。她甚至可能学会如何说出“时间”这个词,但对它没有任何概念;比如在玩追逐游戏时大喊"时间到了!"。这个词的作用是让其他人停止追逐她,这样她就可以自由地系鞋带,或者不输掉游戏。
每种情况都有其独特的领域和解决方案,例如早上8:30而不是9:00离开家门,以免受到责备。尽管一些问题可能开始交织在一起,但它们尚未被归为"时间"的共同问题下,她可能被迫等待,因此足球训练迟到了。当这些重叠问题首次出现时,她将逐个处理它们。她并不认识超出这些问题之外的太多东西。在这里,时间正处于原始阶段。
理解总是有限的
和我们所有人一样,上面那个女孩开始时只拥有更大画面中的一部分,并且在每一个新问题上不断积累。而这幅画面是无限大的。它永远不会完整。理解一个概念并不是非黑即白的;即使你最终对时间有了一个智力上的概念,它也永远不会完整或彻底。因此,可以说没有人有时间的概念,只有与之相关的有用动机、想法和反应的子集。
女孩没有办法绕过这个缓慢的过程,直接获得对时间本质的理解。所有的认知,甚至是对时间这样的抽象概念的认知,都是建立在随时随刻互动的基础上的。她对时间的概念是她解决时间问题的理解。她因为没有足够的时间来完成游戏而感到沮丧,或者因未准时而感到尴尬,这些都是她学习时间的动机。我们在文章开头提到,只有在有动机的情况下,才能进行时间持续性的计算。我们现在可以看到这些动机实际上来自哪里。
与时间相关的问题的多样性是巨大的。它涵盖了社会语言学问题,比如孩子喊"时间到了!"来影响她的玩伴,也包括更私人的问题,比如在一段时间内选择两个活动中的一个。从这些问题中产生了我们在文章开头概述的关于时间的复杂理解。例如,你希望协商和权衡时间承诺,这使您将时间理解为一种“物质”;它是可以互相替代的。你对无法完成所有想做的事情的恐惧,让你渴望更多这种"物质"(更长的生命)。当你"感知"时间时,你所看到的是这些互动中似乎固有的解决方案,或者似乎从中产生出来的解决方案。
诚然,很难理解一个思维如何在没有单一、全面的时间概念的情况下与时间互动。当我们试着想象一个孩子喊“时间到了!”时他在想什么,我们将自己复杂的时间概念投射到他们的行为上,而不是接受对他们来说这只是那一刻的实用词。他们说“时间”,但他们并没有想到时间。
我们成年人对时间及其特性的客观理解——它的排他性、线性顺序等等——是一生分析的结果,而不是起点。我们在各种实际应用中学到了如此多的细微差别,但却忘记了它的来源,以至于认为我们对时间的概念是与生俱来的。我希望这篇文章已经表明,如果不是有无数的问题迫使你朝这个方向前进,你就不会达成这种理解。
这是在LLM中加入客观计时器的缺陷,正如文章开头所述。专注于让人工智能拥有客观“正确”的时间概念是操之过急。基于经验的学习要求我们让时间的概念从粗糙、不完美的种子中有机地演化出来。否则,我们就会剥夺人工智能自己定义时间的机会,从而切断它构建有用的时间概念的选择。就像一个过于热衷于让孩子死记硬背的家长一样,最终的学习是脆弱的,当情况稍微偏离预期时会失败。
这篇文章只是为理解抽象、概念创造、动机和认同如何相互交织奠定了基本基础。为了简洁起见,当我们深入研究意识流时,我们将在以后的几篇文章中更深入地讨论更详细的机制。正如我们将看到的,你思维细节是最重要的;每一刻的意识都是一种识别或赋予身份的实例,并为更广泛的理解体系做出贡献。在下一篇文章中,我们将讨论思维如何创造全新的概念,比如软件或电话。