【译】为AI在一切方面超越我们做好准备

原作：史蒂夫·纽曼

引子：我们有时间准备；第一步是确认我们正在准备做什么

在前几部分中，我重点关注了人工智能的现状。我现在要转向未来，从以下问题开始：我们应该期望人工智能能力进步到什么程度？这些东西会变得多聪明？

俗话说，“我们倾向于高估一项技术的短期效果，而低估长期效果。” 目前围绕 ChatGPT 的炒作周期使我们认为正处于“高估”阶段。这是一项突破性技术，但并未打破世界。未来几年，人工智能的影响将是巨大的，但不会是深远的。许多无聊的工作（以及分散的不那么无聊的工作）将被自动化，发现信息将变得更加容易，一些工作岗位将会消失，另一些则会被创造；社交媒体上的可疑内容将会进一步增加，但这些垃圾内容大多会取代其他垃圾内容。

不过，从长远来看。虽然 GPT-4 在一些重要方面受到限制，但它确实凸显了现代深度学习技术的力量。我认为我们现在可以有信心地预测，在几十年的时间范围内，机器将在几乎所有领域大大超越人类的能力。

“超越人类的能力”是什么意思？

我预计在未来几十年里，我们将看到比我们更聪明、更快、更灵活、更机智的计算机。更擅长编写代码、挑选股票、推出产品、诊断疾病。可能在管理、策略、教学、咨询、写小说、导演戏剧方面更擅长。

不用说，这既令人惊叹又令人恐惧。其含义范围从“治愈癌症”到“100% 失业率”，并以此为基础。当我输入它时，这听起来很疯狂，但我无法查看当前的趋势并看到任何其他轨迹。

现在，我将排除任何涉及物理世界的事情，从洗碗到安装洗碗机。我确实预计超级机器人的时代最终会到来，但我不会尝试预测时间表。人体将一系列非凡的能力融入到一个紧凑的装置中，而运行功率仅为几百瓦。我们距离设计出一款可以举起电视、穿针线、爬山、打鸡蛋的机器人还有很长的路要走，所有这些都需要一个便携式电源，无需充电即可运行数小时或更长时间。构建物理机器和控制它的软件都需要多项突破。我不排除在未来几十年内发生这种情况的可能性，但我断言还没有为它的发生做好准备。

在任何涉及艺术创造力或个人关系的事情上，我怀疑我们会看到人造诗人、管理者、治疗师和小说家，他们的时间轴不会比我在这篇文章中关注的一般技能慢多少；但我目前还没有准备好用连贯的论点来支持这种直觉。无论如何，如果人工智能只是在一系列缺乏创造力、缺乏人际交往的任务上优于人类，那仍然具有深远的影响。

值得注意的是，这三个领域的技能——身体技能、人际技能和智力——在进化史上按顺序出现。因此，也许我们应该预期，我们的智力技能将是最容易匹配的，而我们的身体技能经过数亿年的磨练是最难匹配的。

在后续的文章中，我将探讨人工智能优势的影响、我们如何看待它，以及最重要的是，我们如何才能取得积极的成果。在这篇文章中，我将解释为什么我相信机器会在智力上超越我们，并且会在几十年内做到这一点。

论证简介

我们的大脑并没有什么神奇之处，至少在智力方面是如此。他们所做的任何事情原则上都可以由机器完成。
按照我们今天的理解，神经网络是一种足够的机器。
如果机器能够接近人类的智力，那么它们就能超越它。

我将简要解释每个步骤，然后在其各自的部分中展开每个细节。

第 1 步指出，我们的认知能力（使我们能够诊断疾病、做出科学发现和处理保险索赔）仅依赖于通过涉及突触、神经递质等的化学过程从一个神经元传递到另一个神经元的信号：可以人工复制的机制。换句话说，如果大脑内部发生了任何超科学或仅仅是“奇异”的事情，例如灵魂或彭罗斯-哈默洛夫微管量子效应，那么它对我们的智力能力并不重要。

第 2 步指出，我们今天用来设计和训练神经网络（例如 GPT-4）的基本方法足以重现人类智力。我不认为对当前大型语言模型 (LLM)（即假设的 GPT-5、GPT-6 或 GPT-7）进行直接推断就足够了。我之前写过关于软件工程等任务中当前LLMs与人类表现之间的显着差距；我认为我们不能仅仅通过添加更多的训练数据和炼金术调整来缩小这些差距。但我也不认为我们的神经网络方法不需要任何根本性突破。我认为所需的改进将与支持 ChatGPT 开发的“transformer”架构的开发具有类似的顺序：神经网络的具体设计及其训练方式有一些新的想法，但不是全面的重新思考。

第3步指出，当人工智能与人类能力相匹配时，进步之轮不太可能停止。正如叉车可以比我们搬运更多东西一样，人工智能将能够比我们更努力地思考。

我认为#1 的论点非常有力，而#3 也非常有力。 #2 更多地依赖直觉。

魔法无处可藏

我们的大脑并没有什么神奇之处，至少在智力方面是如此。他们所做的任何事情原则上都可以由机器完成。

再说一遍，在这一步我只是在论证，原则上，应该有可能建造一台能够像人一样思考的机器。借用我关于如何评估机器智能的文章，我将其定义为可以担当各种知识工作者的工作能力，从记者到软件工程师再到保险理算员。

这是“思考”的狭义定义。我不会触及机器是否可以有感情或意识（而不是令人信服地假装拥有这些东西）的问题，更不用说灵魂了。如果你知道p-zombie是什么，我就不会去那里；如果你不这样做，那你就幸运了，这将是一个没有感受性的区域。

我将从两个方面来阐述：我们有什么证据表明大脑（或思考所需的那些方面）只是一台机器？我们有什么证据表明人工智能可以思考？

关于大脑，我们已经非常详细地弄清楚了其内部机制。我们了解大脑如何划分为杏仁核、海马体、颞叶等区域。我们可以看到神经元如何相互连接，我们知道流经这些连接的神经递质，我们可以观察到随着我们学习，连接变得更强，我们可以观察到不必要的连接逐渐消失。

我们还有很多不明白的地方，但我们已经发现了无数种方式，使大脑的化学细节与观察到的“思考”行为保持一致。大脑较大的动物通常更聪明。大脑的物理损伤会导致思维受损。功能磁共振成像扫描显示与思维模式相对应的神经活动模式，以至于我们开始能够使用功能磁共振成像图像来执行粗略的读心术。在接受脑部手术的患者中，我们可以观察到刺激单个神经元可以触发特定的心理图像。我们可以追踪负责某些反射动作的特定神经回路。如果大脑中的电化学过程没有执行实际的思考工作，那么有人会费很大的劲才能让它看起来好像是在执行。

机器从另一端开始工作，一直在稳步解决越来越接近“思考”的问题。最初，计算机只能执行狭窄、僵化的任务，例如下国际象棋，而且它们的执行方式显然与人类的执行方式截然不同。但近年来，深度学习的进步催生了 DALL-E 和 ChatGPT 等程序，它们可以处理更广泛的任务。重要的是，他们这样做的方式似乎更类似于人类的思维，表现出的怪癖和错误虽然不完全是人类的，但看起来更像人类。它们还没有完全实现这一目标，但如果你断言有一条计算机永远无法跨越的界限，那么在计算机尚未到达的地方划出它就变得越来越困难。

思维基于化学过程的神经学证据，以及硅计算机可以做看起来越来越像思维的事情的实际演示，我不确定我们的头脑中是否还有隐藏“魔法”的空间。

深度学习已经足够深了

按照我们今天理解的方式，神经网络是一种足够的机器[创造通用智能]。

正如我之前提到的，这可能是论证中最薄弱的一步。我相信这很可能是真的，但信心不如其他两步。无论如何，如果事实证明创造人类水平的人工智能需要一些根本性的突破，这并不会推翻人工智能最终会超越我们能力的想法。这只会推迟时间表。我将在随后的文章中更深入地探讨时间问题。

我想要表达的直觉是，随着最近技术的发展，使我们能够训练非常大且有能力的神经网络——这些技术导致了 Midjourney、DALL-E、AlphaFold 2 和 ChatGPT 等程序——我们现在正走在一条稳步上升的道路上，这将导致人类水平的通用智能。

这将背离过去的经验。以前的人工智能方法，例如“专家系统”和“符号系统”（又名 GOFIA，Good Old-Fashioned AI，这种思想在 20 世纪的大部分时间里主导了该领域），在某些特定任务上取得了成功。他们使计算机能够下棋并检测信用卡欺诈。然而，这些系统通常很脆弱，一项任务的成功往往不会导致其他任务的成功。进展断断续续，也有很多令人失望的情况，导致了多个时期的“人工智能冬天”（在过高的期望没有得到满足后，资助和研究活动暂时崩溃）。

相比之下，最近人工智能一直在不断发展。在过去的 7 年里，我们看到计算机在围棋和扑克、创建视觉图像、识别语音等任务中的表现达到或超过了人类的典型表现。预测蛋白质分子结构这一艰巨任务取得了惊人的进展。当然，最近大型语言模型的快速进展，例如（快速连续地）GPT-3、GPT-3.5 和 GPT-4。

所有这些系统都基于神经网络。所有这些都表现出灵活性和鲁棒性，这更像是人类智能，而不是像旧的脆弱的专家系统或符号系统。所有这些都主要基于神经网络通过重复示例的训练来“学习”其任务，而不是必须使用国际象棋、蛋白质结构或英语语法知识进行显式编程。

人类大脑的适应性非常强。我曾经读过的一本小说指出，我们的大脑“被设计来拖着我们可怜的屁股穿过大草原，从那时起就没有太大的升级”。然而我们可以确定原子的结构，或者设计一座吊桥。天生失明的孩子会将更多的大脑投入到其他感官上。大多数人仅仅通过几个小时的尝试和失败就可以学会杂技。

传统软件从未表现出这种灵活性。计算机是出了名的不灵活。但神经网络的适应性似乎惊人。针对一项任务训练的网络通常可以快速适应完全不同的任务。深度学习似乎可以处理几乎任何我们可以以允许渐进成功和大量训练数据的方式提出的任务。与人脑的类比并不完美；一方面，我们当前训练神经网络的过程与人们学习的方式有很大不同。但我们似乎以一种前所未有的方式处于大致范围内。

在《人工智能需要什么来完成我的工作？》中，我试图概述人工智能在进行严肃的软件工程之前需要解决的缺失功能。该列表包括诸如记忆和探索性问题解决之类的内容，这些内容让我觉得在现有的深度学习范式中很容易处理。我们可能需要一些关于网络架构的聪明的新想法。我们需要找到一种方法来呈现探索性问题解决的任务，以便可以对网络进行训练。考虑到投入该领域的资源规模，这些似乎是可以实现的。

在结束本节时，我将指出，过去的突破性成就分为两类。第一个是几乎不可能的事情，突破了基础科学的极限。例如，阿波罗登月要求火箭的每个部件都尽我们最大的能力进行优化：最强大的发动机、最薄的船体、最小的电源。这种超优化的解决方案往往无法超出其最初开发的确切目的。

第二类通常涉及寻找一种新方法来利用已经存在的基本功能。例如，互联网是一种使用现有计算机和连接（例如电话线）的新方式。 iPhone 应用程序商店只是使用手机通用处理器和数据连接的一种新方式。这些都是灵活、强大的系统，并且每一个都引发了用例的寒武纪大爆发。

一般而言，深度学习，尤其是像 GPT 这样的大型语言模型，似乎完全属于后一类，这意味着我们可以期待进一步的快速进展。这增强了我们找到缩小 GPT-4 与更通用智能之间差距方法的信念。

一旦机器进入比赛场地，他们就会获胜

如果机器可以接近人类的智力，那么它们就可以超越人类。

我的第三个论点：一旦我们能够创建一个能够执行人类水平的一般智力任务的人工智能，我们就会进一步创建比这更强大的系统。我的理由如下：

没有理由相信人类的能力代表了智力的任何基本极限。

人类的能力源于未知的进化：环境强加给我们的需求，以及我们的身体结构、卡路里摄入量等限制范围内可能实现的能力。选择任何人类属性——力量、耐力、智力、创造力、智慧、灵活性、记忆力。我不知道有任何原则性的论点表明人类在这些水平上的能力代表了任何类型的限制。许多动物的身体特征超过了我们。计算机一直在稳步获取智力成果。要论证人类水平的智能有一些特殊之处，以至于机器无法超越它，你必须解释：

为什么这个限制不适用于机器已经超越我们的领域，从下棋到预测蛋白质结构。
为什么在仅重 3 磅的大脑中可以达到智力的基本极限，该大脑的设计适合通过产道并在约 20 瓦的功率下运行。换句话说，为什么不受这些限制的大脑不可能更聪明。。
为什么我们会定期看到一些特殊天才——约翰·冯·诺依曼、斯里尼瓦萨·拉马努金——他们能够完成看似超人的智力壮举。如果人的能力是有极限的，为什么这些人能够超越它？或者说这个极限是由这些稀有个体以某种方式定义的吗？

简而言之，任何关于我们是可能存在的最聪明的生物的建议，都可能类似于原始冶金学家推测他的木炭火是可能存在的最热的东西。

进化论没有理由促使我们获得对当今知识工作至关重要的能力。

回想一下，我将“人类水平的智力”的概念锚定在担任各种知识工作者工作的能力上。此类工作涉及的许多活动在人类历史上都是相对较新的。追溯到几百年前——从进化的角度来看，一眨眼的功夫——大多数人都是靠务农或其他低技术职业谋生的。几乎不需要使用复杂的抽象系统，或者跟上不断涌现的新科学研究。我们成为科学家和技术专家的时间不长；没有理由相信我们在进化上倾向于做得最好。

从历史上看，每当机器在某一特定领域与人类能力相匹配时，它们很快就会超越人类。

任何低端汽车的行驶速度都比人跑得快得多。叉车可以搬运更多的东西。人类棋手无法与最好的国际象棋程序进行较量。如果将人类图书管理员与 Google 进行信息检索的速度和广度进行比较，或者将数学家与计算机进行 π5 数字的计算进行比较都是荒谬的。一旦机器能够在特定任务中与人类的平均能力进行竞争，它们通常会呼啸过去，进入超人类的领域。

当然，虽然机器在特定任务上通常会超越人类的能力，但从历史上看，它们是以狭窄的方式做到这一点的。在铺好的道路上，汽车的距离会超过人，但在茂密的森林、陡峭的山坡或室内走廊上，汽车的距离就不会超过人。 Apple II 可以通过编程来计算比任何人都多的 π 位数，但无法开发新的数学定理。这就是为什么基于深度学习的系统的灵活性和通用性如此重要。

人工智能将拥有巨大的优势来弥补任何劣势。

我认为 GPT-4 使用海量的知识库来弥补推理能力的缺陷。为了解决任何缺点，未来的人工智能将能够利用各种字符串，可能包括（但不限于）：

速度：GPT-4 的打字速度已经比我阅读或说话的速度快得多。很难确定假设的“通用智能”人工智能的处理速度会如何比较，但摩尔定律尚未完全发挥作用，神经网络架构和芯片设计还有很大的进一步改进空间。据猜测，几十年后的人工智能将能够比我们思考得更快，让他们有时间推理解决任何他们认为困难的任务。
耐力：一年 365 天、每天 24 小时全力以赴的能力，不会感到疲倦、无聊、没有动力、心烦意乱或生病。我认为没有足够的时间让我再次使用终结者模式，但说真的，它不会停止，直到它完成你告诉它做的任何事情。
数字：同样，这只是一个猜测，但未来的人工智能可能会比付费人类员工更便宜，特别是考虑到管理费用时：不仅仅是福利和（对于那些仍然使用它的人）办公空间，还有招聘、管理和其他软成本。这意味着使用多个人工智能实例（可能是多个实例）来替代单个人在经济上是可行的。出于多种原因，我希望人工智能能够比我们更有效地协同工作，首先是相同基础人工智能的实例应该很少出现沟通不畅的问题。
知识库：今天，GPT-4 拥有比任何人类都要广泛得多的常识基础。
集成：人们已经在使用“插件”扩展语言模型，使他们能够访问从数据库到 Wolfram Alpha 的所有内容，再到动态编写和执行自定义程序的能力。随着时间的推移，这种集成只会变得越来越深入，直到人工智能能够运行数据库查询、执行复杂的数学运算或在技术手册中查找内容，就像你看时间一样随意。

总结

我认为证据非常清楚，在某种程度上，机器将超越人类的智能。我们可以看到，在我们执行智力任务的机制中，没有任何魔法，也没有什么超出科学的范围。对于科学所能解决的问题，我们一直在寻找方法来创造出超越人类的机器。

我进一步认为，我们将在几十年内找到实现这一目标的方法，而无需任何基础的科学进步。诚然，这里的证据比较模糊，我将在后续的文章中尝试进一步阐述这些想法。但至少，我认为我们必须假设，具有深远影响力的人工智能很有可能在未来几十年内出现，因此是时候开始考虑其影响了。

当然，正如俗话所说，“如果属实，那就巨大”。

posted @ 2024-01-21 22:10 白鹿原老张阅读(7) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

好好学习，天天向上

读无字之书,品惊人妙句,会难通之解,参最上禅机

【译】为AI在一切方面超越我们做好准备