【转载】人人都能看懂的大模型原理(五)

 

五、 组合创新理论和智能涌现回顾

如上文所述,大模型只是学习数据内在模式的分布。生成的过程是采样并解码出数据。那么AIGC怎么可能有创新能力呢?然而现实中大模型表现出很强的创新能力,广泛用于作画和写文章。大模型表现出的创新能力来源哪里呢?大模型为什么会出现幻觉呢?这一章,我们一起来揭开这些现象的神秘面纱。

5.1 组合创新理论

        大模型从大量训练数据中学习到了语义的分布,但是人类的语言语义是有多种属性,它是多种属性的组合。为了表达方便,我们称每一种属性叫做语义属性。比如当我们组织语言的时候,我们组合了逻辑、情感、表达方式、句法、语法等多组语义属性。语言组织能力强的人,这种语义属性组合能力就很强,比如丘吉尔这些人。实际是,语义属性有可能都不是离散的,它可能是无穷多且连续的。在自然语言领域,可以列举的语义属性包括概念、事实、语法、语言情感、思维链逻辑、语言风格等等。在图像领域,我们甚至都无法穷举出图像的语义属性,图像的尺度、光线方向和明暗、纹理与颜色这些都是连续的变量,无法穷举。

       我们假设我们学习到了所有的语义属性的分布,那么生成的过程就是从这些语义属性分布中进行采样。如果这些分布都是解耦开的,那么是不是意味着我们可以对他们进行组合式采样,譬如从概念分布中采样一组概念,从事实分布中采样一种事实,从语言风格采样一种行文风格?如果再把这些采样的语义进行组合并解码,不就得到了一种新的组合式创意文案了吗。如下图所示,利用胡锡进的口吻写一篇俄乌战争的微博。因为我们学习到了胡锡进的行文风格,也学到了俄乌战争的事实,所以我们就可以组合成一种新的文本表达了。图像生成创意图片的道理也是如此。

图5.1 文本组合创新示例

结论:AIGC的创新来自于语义属性的组合。对于机器来说是组合,但是对于人类来说就是创新。我们人类的绝大多数创新不就是组合式创新吗? 美术学院的学生大部分时间都在学习前人的作画风格,并且结合新的场景,创作出新的作品。发明前无古人的作画风格的大作家是很少的,组合式创新已经能满足社会生产的大部分需要了。

5.2 小心反事实创新

        机器根据人类可控的信号,在多种语义属性内进行组合采样。可是我们知道并不是所有的生成组合都是可控的。如果某种语义属性的组合产生了反事实的错误,那就是灾难的。比如图像创作领域,对于敏感的人体的生成是不允许出错的。对于文本创作领域,绝不能出现反人类、种族歧视等表达。

        因为深度学习的不可解释性,我们还无法对所有语义属性进行控制。目前理论上还无法对AIGC的反事实错误有百分百有效的技术手段。但是可以通过RLHF强化学习方法来约束模型的生成趋势。通过大量的人类参与标记的预料,通过学习奖励模型,然后用强化学习策略来对模型生成的偏好进行约束,使得模型尽量满足人类的偏好。

5.3 解耦学习和模型可解释性

        我们可以这样理解特征学习。在过去判别模型时期,通过判别任务来学习数据的特征或者语义。这些特征能够帮助目标任务进行线性可分。在生成式AI中,我们是利用生成任务来学习数据的特征或者语义。无论是判别模型还是生成模型,我们真的知道这些特征是怎么帮助模型做判别或者生成的吗?模型就像一个黑盒一样,是不可解释的。你不知道哪个权重或者哪个链接对结果产生怎样的影响。这就是模型的不可解释性难题。

        试想一下,有没有可能通过生成任务让特征解耦呢?毕竟从生成的结果可以很直观的判断哪个语义属性得以体现,而哪个语义属性被忽略了。因此,通过对生成结果的判断,就可以分析语义属性是否被解耦了,这种特征学习方法被称为特征解耦学习(Disentangled Representation Learning)。图5.2是一个典型的解耦学习的例子,能够讲汽车的颜色、品牌等因素解耦出来。但是很遗憾,这种方法目前泛化性还不强,只能够解决少部分问题,理论方法还有待继续研究。不过作者对该方向特别看好,是一项非常有应用前景的技术。

图5.2 图像生成解耦学习

 

5.4 智能涌现回顾

     到此,我们已经完成了AIGC理论部分的全部介绍。其中可能存在大量错误和忽视的技术点和细节,作者能力有限,请读者见谅。

    我们在第一章的时候讨论过大模型的智能涌现能力,我们在此重新回顾什么是智能涌现。智能涌现外在表现为举一反三的能力、思维链能力、创新能力。如果不加以仔细分辨,能容易让人产生误解,认为人工智能已经具备人的独一无二的学习、推理、创造能力,继而引发不必要的人工智能威胁论。然而当系统性了解AIGC的机器学习原理之后,我们可以深刻理解这三种智能涌现都是假象。

    所谓举一反三的能力,仅仅是因为大模型训练过程中运用了大量的数据导致的泛化性提升而已;所谓思维链能力,仅仅是因为思维链本身也是一种内在的语言逻辑,当增加包含这种思维链逻辑的预料的时候,思维链能力就会增强;所谓创新能力只是不同语义属性的重新组合而已。虽然我们认为智能涌现是假象,但是并不妨碍它被我们运用到社会生产中。

posted @   bonelee  阅读(243)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
历史上的今天:
2021-09-22 wifiphisher实现无线渗透WiFi钓鱼
2021-09-22 Threat Hunting中几个文章——写得较好,待深入
2021-09-22 SQLFlow——除了 Google 的 BigQueryML,微软基于 SQL Server 的 AI 扩展,以及 Teradata 的 SQL for DL 同样旨在连接 SQL 和 AI,让人工智能的应用变得像 SQL 一样简单
2017-09-22 python 统计文件top IP
点击右上角即可分享
微信分享提示