【读书笔记】ISBN9787121353932
【前言】
是否所有人都可以公平地享受科技发展带来的生产力进步?
AIGC应用越完善,内容生产的社会必要劳动时间就越少,人工就越没有价值。全社会新增劳动岗位的速度很快就会跟不上AIGC应用取代人工的速度,而不会使用AIGC应用的劳动者可能将无法获得收入、无法进行消费,从而逐步被剥离出经济循环。
科技本身并不具有公平性。新科技的诞生需要以巨大资源聚集为前提,其应用落地更不会在全世界平均分布、等速进行。但是,人类文明需要公平。
不过有一点毋庸置疑:世界正在被AIGC改变,并且变化的速度逐渐加快。若干年后回顾人类历史,或许此时的我们已经身处一次爆炸式生产力变革之中。
【第1章】
<2>
AIGC,AI Generated Content,人工智能生成内容
<3>
人工智能(Artificial Intelligence,AI)
“专家系统”
研究人员只清楚AI的功能及如何使用这些功能,并不能够准确地理解机器如何进行推理与测算。
<4>
大型语言模型(Large Language Model,LLM)
元宇宙将极大地扩展人类的存在空间,而在迈向元宇宙的过程中,需要大量的数字内容来支撑,仅靠人工设计和开发根本无法满足需求,AIGC应用正好可以解决这个问题。
<11>
基建供应商或许是最大的赢家,它们获得了大量的利润,收入快速增加。
提供AI训练的设备,如高性能显卡
模式提供商……绝大部分都还没有完全商业化……创造最大价值的公司——训练生成式AI模型并将其应用在应用程序中的公司,尚未获取最大的价值。
<12>
Stability AI是一家由AI驱动的视觉艺术初创公司。
<13>
Scale AI——服务于公司客户的AI基础设施服务商。
<14>
高端学府不仅为这些未来的科技大佬们提供了优良的教育和科研支持,还为他们构建了优质的交友圈。
<15>
具有良好的基因和家庭教育环境。
为什么要关注AIGC?
因为全世界最聪明的人和最有钱的人都在这么干。
【第2章】
<17>
自然语言处理(Natural Language Processing,NLP)
时序神经网络
循环神经网络(Recurrent Neural Network,RNN),“梯度消失”
<18>
长短期记忆(Long Short-Term Memory,LSTM)网络
Transformer模型,注意力机制
双向编码器表示(Bidirectional Encoder Representation from Transformer,BERT)模型
生成预训练(Generative Pre-Timing,GPT)
BERT模型具有较强的序列关系和语法描述能力,自然语言理解
GPT系列模型,自然语言生成
Stable Diffusion模型,图像生成、图像修改
<19>
基于规则的生成算法主要通过制定规则来生成新的数据
规则体系
模板匹配法
基于规则生成的内容具有较强的可控性和可解释性,但是对于规则和模板的定义,需要有一定的先验知识和对相关领域技术的理解。
由于受到规则和模板的限制,生成的内容具有较强的局限性,难以满足丰富和多样化的要求
<20>
变分自编码器(Variational AutoEncoder,VAE)
自编码器(AutoEncoder,AE)
编码器;潜在特征表示;解码器
无监督学习
<21>
重构误差(Reconstruction Error,RE):均方误差(Mean Squared Error,MSE)、二元交叉熵(Binary Cross-Entropy)
VAE用概率编码器和概率解码器来代替AE中确切的编码和解码过程。
VAE主要实现了描述隐空间的概率方式,编码器的主要目的是描述每个潜在特征表示的概率分布。
<22>
零和博弈理论,生成对抗网络(Generative Adversarial Network,GAN),无监督学习领域
<23>
其基本思想是同时训练两个网络,生成器、鉴别器
当输入是由生成器生成的样本时,鉴别器本身的期望输出趋近于0,但此刻生成器期望鉴别器输出趋近于1,达到零和博弈的状态。
<24>
我们期望从GAN模型中学习到一个有意义的隐向量,从而使得隐向量中的每个特定值和特定的生成样本一一映射。
模式崩溃问题
修改生成器和鉴别器的模型架构
<25>
改变生成器和鉴别器的损失函数
<27>
Transformer,基于自我注意力机制的深度学习模型
注意力机制,把注意力放到主要或重要的信息上,忽略大量不重要的信息,不但解决了长期依赖问题,同时还实现了模型的并行能力,且通过一步矩阵计算就可以获得较大范围的信息。
自我注意力机制(Self-Attention)
多头注意力机制(Multi-Head Attention)
——2023-4-22
【第3章】
<50>
AIGC应用界限:算力、预设
<64>
AI撰写软件虽然能帮助我们提高效率,但是我们不应该过度依赖AI撰写软件。在撰写文章的场景下,只有自己用心思考和写作,才能培养批判性思维能力,在写作的同时有更多的收获和沉淀。AI撰写软件可以帮我们快速地制定框架或为我们提供更多的想法,但不应该成为我们偷懒的工具。
<70>
AI代码撰写:根据用户的指令自动撰写代码,并可以根据需求输出对应的计算机语言。……实时地为用户撰写的代码提供修改建议,还可以根据用户的要求自动撰写一部分代码。……帮助开发者自动转换代码语言,节省大量的学习成本。
<74>
AI搜索引擎:使用AI模型,给用户的搜索问题输出一个总结性的答案,并说明该答案的来源,方便用户判断答案的可靠性。
<85>
对于普通人来说,如何决策方向和规划愿景,是AIGC应用无法代替的。在未来,更多的简单工作会被AIGC应用所代替,这让人们可以更加专注于做决策性的工作。
【第4章】
<120>
技术的发展是必然的,这些技术出于解放生产力的目的而被研发。这本无恶意。如果技术只被少数人掌握而不被大众所知,那么这种信息查反而可能造成可怕的后果。
【第5章】
<177>
图片作为最常见的内容形式,存在于生活中的各个角落。或许在一两年后,手机应用的开屏动画、电子广告牌上的广告、社交平台上的视频广告等都是通过大数据和算法模型实时创作的,AIGC应用将潜移默化地影响我们的审美和生活选择。
<178>
(AI的作用)不应该是替代插画师,而应该是一个强大的辅助工具:一个能够将想法快速可视化、快速拓展思维边界、寻找灵感、让普通人也能进行自由创作的工具。
<180>
仅仅简单地用严格保护版权的方式,并不是创作者最好的选择。毕竟,AI绘画工具可以从艺术中释放巨大的生产力,所以生产关系可能需要做出一些适当的调整。
……
利益相关性不可避免地会产生立场偏向。……我们很难鉴别支持或者反对的声音是来源于对人类文明发展的深层思考,还是对艺术理念的坚持,或仅仅是与个人利益相关导致的偏好。
艺术和技术,或者说艺术与生产力的发展,本来就息息相关。
<181>
艺术的创作方式和载体不断演变。……从艺术发展的历史来看,新技术带来的艺术理念革新大概率是个体无法阻挡的。
无论支持与否,图片生成技术的发展都如火如荼。它已经有了广泛的民用场景和商业价值。抵制图片生成技术的应用似乎已经毫无意义,我们的关注点或许应该集中在“如何正确使用”上。
【第6章】
<206>
科学技术的进步从不以个人的意志为转移。……在面对技术的发展时,把关注点放在如何利用这个技术并应对挑战,可能才是正确的。
【第7章】
<208>
AI的“三驾马车”是数据、算法和算力。
<210>
“训练”的实质就是计算——反馈——调整——计算的往复过程,“推理”的实质是针对某个应用场景的输入——计算——输出的过程。
<212>
虽然GPU是为图像处理而生的,但深度学习的计算类型和图形渲染有很多的共通点。在图形渲染中,芯片需要不停地计算移动对象的轨迹,这需要大量的并行数学运算,而机器学习/深度学习设计大量的矩阵/张量运算。因此,GPU的并行处理架构也能够很好地满足AI计算的要求。
<214>
按照AI芯片的分类,我们使用AIGC应用的过程本质上是一个推理过程。……人们在使用ChatGPT这种AIGC应用(推理)时,理论上,对芯片的性能要求不需要像训练那么高。
<216>
我们有可能看到未来会有越来越多的终端芯片需要提高对AI算法的支持性。与资金门槛和技术门槛极高的云端芯片相比,终端芯片普及的趋势必将会给更多的芯片公司带来机会。
【第8章】
AIGC应用不仅会带来内容范式的变化、生产力的变革、商业模式的迭代,还会带来分配方式和大众认知的变化,最终会推动人类文明进入下一个纪元——智能文明时代。
<233>
避免被AIGC应用取代的关键就在于,保持作为“人类”的核心竞争力。
第一个思路是在从业领域达到顶级水平,第二思路则是学会使用AIGC应用。
<234>
用抵制新技术应用来缓解技术性失业无异于本末倒置。解决这一问题的核心方法是,公平地向全社会提供接触、学习和认识新技术的机会,从而让更多的人能跟上技术发展的步伐并从中受益。
<236>
AIGC驱动的生产力工具让很多人事半功倍,从日常琐碎和高度重复性的工作中释放出来,更加专注于自己的创意表达。……再高效的生产力工具归根到底还是工具,如果缺乏了人的愿景和目标,就没法完成任务和使命。从短期来看,AIGC应用不会完全取代创作者,但是可能会取代那些不懂得使用AIGC应用的创作者;从长期来看,各位读者更不必担心自己的工作是否会被取代,因为那是必然的。
<237>
每天人类产生的任何形式的内容,都是AIGC应用训练数据的来源。从这个意义上来说,人类是AIGC应用的老师,而AIGC应用则代表了人类的群体智慧。
决定AIGC应用“三观”和“能力”的永远是人类。……人类每一次输出的内容都在对未来AIGC应用的决策产生影响。
AIGC应用在倒逼人类提高逻辑能力。AIGC应用的逻辑强不代表人类就可以降低对自己的逻辑能力的要求,相反,人类更需要有逻辑能力来理解并驾驭AIGC应用生成的内容。
<238>
与AIGC应用相比,我们的大脑强在创新型上。AIGC应用智能提取现有的都系,而创造不存在的东西还得靠人脑。所以,作为人类的我们在提高逻辑能力的同时,对创作保持热情也至关重要。
不过大家也不用焦虑,因为我们需要焦虑的是通过自己的努力能够改变的事情,而AIGC应
用取代人类工作是无法阻挡的历史既定进程。作为人类,我们能做的就是,找到自己的核心竞争力,并且不断努力提高核心竞争力,找到自己的“生态位”。
——2023-4-26