[人工智能]初识
人工智能
摘抄自《深度学习之Pytorch》。
定义
人工智能(Artificial Intelligence),也称机器智能,是指由人工制造出来的系统所表现的智能。所谓的智能,即值可以观察周围环境并据此作出行动已达到目的。
分类
人工智能的概念很宽泛,现在根据人工智能的实例将它分为三大类:
- 弱人工智能(Artificial Narrow Intelligence,ANI)
弱人工智能是擅长单个方面的人工智能,如AlphaGo。
- 强人工智能(Artificial General Intelligence,AGI)
达到类人级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活,它都能干。创造强人工智能比创造弱人工智能难得多,目前还做不到。 Linda Gottfredson教授把智能定义为“一种宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。”强人工智能在进行这些操作时应该和人类一样得心应手。
- 超人工智能(Artificial Super Intelligence,ASI)
牛津哲学家、知名人工智能思想及 Nick Bostrom把超级智能定义为 “在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。”超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍。
数据挖掘、机器学习和深度学习
数据挖掘
简而言之,数据挖掘就是在大型的数据库中发现有用的信息,并加以分析的过程,也就是人们所说的KDD(knowledge discovery in database)。
一个数据的处理过程,就是从输入数据开始,对数据进行预处理,包括特征选择、规范化、降低维数、数据提升等,然后进行数据的分析和挖掘,再经过处理,例如模式识别、可视化等,最后形成可用信息的全过程。
所以说数据挖掘只是一种概念,即从数据中挖掘到有意义的信息,从大量的数据中寻找数据之间的特性。
机器学习
机器学习算是实现人工智能的一种途径,它和数据挖掘有一定的相似性,也是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。不同于数据挖掘的从大数据之间找相互特性,机器学习更加注重算法的设计,让计算机能够自动地从数据中“学习”规律,并利用规律对未知数据进行预测。因为学习算法涉及了大量的统计学理论,与统计推断联系尤为紧密,所以也被称为统计学习方法。
分类
机器学习可以分为以下五个大类:
-
监督学习: 从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归与分类。
-
无监督学习: 无监督学习与监督学习相比,训练集没有人为标注的结果,常见的无监督学习算法有聚类等。
-
半监督学习: 介于监督学习与无监督学习之间的方法。
-
迁移学习: 将已经训练好的模型参数迁移到新的模型来帮助新模型训练数据集。
-
增强学习: 通过观察周围环境来学习。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。
机器学习算法
传统的机器学习算法有以下几种:线性回归模型、logistic回归模型、k-临近算法、决策树、随机森林、支持向量机、人工神经网络、EM算法、概率图模型。
深度学习
深度学习的最初级版本是人工神经网络,这是机器学习的一个分支,其试图模拟人脑,通过更加复杂的结构自动提取数据特征。
深度学习结构
随着神经网络的发展,目前比较流行的网络结构分别有:深度神经网络(DNN)、卷积神经网络(CNN)、循环递归神经网络(RNN)、生成对抗网络(GAN)等等。