读人工智能时代与人类未来笔记06_机器学习的力量

1.       挑战

1.1.         不同的目标和功能需要不同的训练技术

1.2.         我们必须关注人工智能的潜在风险

1.2.1.           应对日益盛行的人工智能将带来的风险,是一项必须与该领域的进步并行的任务

1.3.         我们不能将其开发或应用随便交予某个群体,无论这个群体是研究人员、公司、政府还是民间社会组织

2.       机器学习的三种形式

2.1.         监督学习

2.1.1.           监督学习是一种卓有成效的方法,可以用于创建一个模型来预测响应新输入的输出

2.1.2.           人工智能开发人员使用了一个包含示例输入的数据集,并且这些示例根据期望的输出或结果分别进行了标记

2.1.3.           发现Halicin的人工智能便是由监督学习产生的

2.2.         无监督学习

2.2.1.           在无监督学习中,训练数据只包含输入

2.2.2.           在只有大量数据的情况下,开发人员可以使用无监督学习来提取可能有用的见解

2.2.3.           无监督学习允许人工智能在没有任何结果信息的情况下识别模式或异常情况

2.2.4.           通过无监督学习训练的人工智能可以识别出人类可能因为模式间的微妙差别、数据规模过大或两者兼有而错过的那些模式

2.2.5.           此类人工智能也和人类自学者一样,可能给出古怪荒谬、毫无意义的结果

2.3.         强化学习

2.3.1.           在强化学习中,人工智能不是被动地识别数据之间的关系,它是受控环境中的“智能体”,会观察并记录环境对其行为的反应

2.3.1.1.            强化学习需要人类参与创建人工智能训练环境(即使人类在训练过程中不提供直接反馈):人类定义了模拟器和奖励函数,人工智能则在此基础上进行自我训练

2.3.2.           即使是在模拟的、简化的环境中,比如一场国际象棋比赛,一步走棋也可能引发一连串的机会和风险

2.3.3.           在装配线上精准模拟机器人的操作显然比在拥挤混乱的城市街道上更容易

2.3.4.           其结果便是,指导人工智能在人工环境中自我训练通常并不足以产生最佳表现,还需要有反馈

2.3.5.           奖励函数的任务就是提供这种反馈,为的是向人工智能表明它的方法有多成功

2.3.5.1.            作为替代,程序员将这种奖励函数自动化,谨慎而又精确地指定该函数如何运行及如何模拟现实的性质

2.3.5.2.            在理想情况下,模拟器提供真实的体验,奖励函数则促进有效的决策

2.3.5.3.            为了获得有意义的结果,对模拟器和奖励函数的周密规范至关重要

3.       机器学习的力量

3.1.         在农业领域,人工智能使得农药的精确管理、疾病的检测和作物产量的预测更为便利

3.2.         在医学领域,人工智能促进了新药的发现、现有药物新应用的鉴定,以及对未来疾病的检测或预测

3.2.1.           人工智能已通过识别细微的放射指标,比人类医生更早地发现了乳腺癌

3.2.2.           通过分析视网膜照片发现了失明的原因之一是视网膜病变

3.2.3.           通过分析病史预测糖尿病患者的低血糖

3.2.4.           通过分析遗传密码发现了其他遗传性疾病

3.3.         在金融领域,人工智能被用来帮助推进贷款批准(或拒绝)、收购、合并、破产声明和其他交易流程

3.4.         千百年来,人类一直无法跨越文化和语言鸿沟进行清晰的沟通

3.4.1.           由于存在语言之间的理解误差,而且无法用一种语言向另一种语言的使用者传达信息,人类彼此之间产生了误解,阻碍了贸易,甚至引发了战争

3.4.2.           在巴别塔的故事中,这种语言的阻隔是人类不完美的象征,也是对人类傲慢的痛苦惩罚

3.5.         机器翻译水平突飞猛进

3.5.1.           与其说是因为应用了神经网络或机器学习技术,不如说是这些方法全新的、创造性的应用催生了这一进步

3.5.2.           从机器学习的基本构建模块开始,开发人员能够以巧妙方式继续创新,并在这个过程中解锁新的人工智能

3.5.3.           要将一种语言转换为另一种语言,译者需要捕捉特定的模式,即顺序依赖关系

3.5.4.           与传统的监督学习相比,语言翻译研究人员采用了“平行语料库”(parallel

corpora)技术,这种技术在训练中不需要输入和输出之间有具体对应关系

3.5.4.1.            这种方法极大地限制了训练数据量以及可用的文本类型

3.5.4.1.1.             政府文本和畅销书经常被翻译,但期刊、社交媒体、网站和其他非正式作品一般并无此待遇

3.5.4.2.            这种训练人工智能粗略匹配(而非翻译)文本主体的过程,即为平行语料库技术

3.5.4.3.            被用于训练的是高度近似的或部分的信息

3.5.5.           当谷歌翻译开始采用使用平行语料库训练的深度神经网络时,其性能提高了60%,而且此后一直在不断提高

3.5.6.           自动化语言翻译的巨大进步有望令商业、外交、媒体、学术界和其他领域均为之一变,因为人们可以比以往任何时候都更容易、更快捷、更廉价地接触到非母语

3.6.         机器学习不仅拓宽了人工智能的适用范围,还彻底改变了人工智能本身,甚至在以往的方法曾取得成功的领域(如基于符号和规则的系统)也莫不如此

3.6.1.           标准的神经网络可以识别输入和输出之间的关联模式,比如那些抗生素的一系列化学属性

3.6.1.1.            谷歌的BERT就是一种旨在改进搜索的双向转换器

3.6.2.           翻译文本和分类图像的能力是一回事,生成(亦即创建)新文本、新图像和新声音的能力则是另外一回事

3.7.         生成式神经网络,却可以实现创建

3.7.1.           生成式神经网络使用文本或图像进行训练

3.7.2.           它们产生新的文本或图像,这些文本或图像是合成的,但也是真实的

3.7.2.1.            从概念上讲,它们与其“前辈”已有所不同

3.7.2.2.            这些所谓的生成器的应用是令人惊愕的

3.7.2.2.1.             如果它们被成功应用于编码或写作,那么作者可以简单地创建一个大纲,然后让生成器来填充细节
3.7.2.2.2.             生成器还可能被用来进行深度伪造,即对人们从未做过的事情或说过的话进行虚假描述,且足以乱真

3.7.3.           生成器将丰富我们的信息空间,但如果没有监督,它们也可能模糊现实和幻想之间的界限

3.7.4.           能够产生类人文本的GPT-3是最值得关注的生成式人工智能之一

3.7.4.1.            它打开了将语言翻译转化为语言生产的新局面

3.7.5.           经过对主要来自互联网的大量数据的训练,转换器还可以将文本转换为图像或进行反向操作,即扩展和压缩描述,并执行与此类似的任务

3.8.         当一项技术变得更加强大、更加普遍时,其发展也必然伴随着挑战

3.8.1.           我们大多数人最常使用的在线功能“个性化搜索”就是一个例证

3.8.1.1.            人工智能可以记住搜索引擎以前被问及的事情及其作为回应而产生的概念

3.8.1.2.            从理论上讲,这对用户也越来越有帮助

3.8.2.           在线流媒体服务也在如法炮制,它们利用人工智能使针对电视节目和电影的建议更明确、更积极,或给出人们希望获得的更多答案

3.8.3.           随着人工智能对人们的了解越来越深入,获得的结果大体上还是积极的

4.       生成对抗网络

4.1.         简称GAN

4.1.1.           一种常见的生成式人工智能训练技术是让两个学习目标互为补充的网络进行对抗

4.2.         生成器网络的目标是产生潜在的输出,而判别器网络的目标是防止产生不良的输出

4.3.         生成器的任务是进行头脑风暴,而判别器的任务是评估哪些想法是相关的和现实的

4.4.         在训练阶段,生成器和判别器交替训练,训练判别器时保持生成器不变,反之亦然

4.5.         经过GAN训练的人工智能可以在人们起草电子邮件时建议补全句子,或者允许搜索引擎完成部分查询

4.6.         程序员可能很快就能省力了,他们只要勾勒出所需程序的大纲,然后将大纲交给人工智能完成即可

5.       过滤

5.1.         过滤可以帮助引导选择

5.1.1.           在现实世界中,外国游客会雇用导游,并根据自己的宗教信仰、国籍或职业,让导游带他们参观他们认为最值得去的历史古迹或最有意义的景点

5.2.         过滤也可以通过省略和遗漏信息而成为一种审查制度

5.3.         在网络空间,过滤会自我强化

5.3.1.           它会放大一些主题和来源,并出于实际需要而对其他内容视而不见

5.3.2.           这种事实上的遗漏的后果是双重的:既可以让个人变得闭目塞听,也可以让这些个体彼此难以一致

posted @ 2024-05-18 07:55  躺柒  阅读(43)  评论(0编辑  收藏  举报