人工智能导论——人工智能、机器学习和深度学习之间的区别与联系
一、人工智能--在机器实现智能
人工智能(Artificial intelligence)简称AI。是一门研究如何构造智能机器(智能计算机)或智能系统,使它能模拟、延伸、扩展人类智能的计算机学科。通俗的来说,人工智能就是要研究如何使机器具有能听、能说、能看、会写、能思考、会学习、能适应环境变化、能解决面临的各种实际问题等功能的一门学科。人工智能即是用人工的方法在机器(计算机)上实现的智能。
人工智能研究的基本内容主要有:知识表示、机器感知、机器思维、机器学习、机器行为这五方面。主要研究领域主要有:自动定理证明、博弈、模式识别机器视觉、自然语言理解、智能信息检索、数据挖掘与知识发现、专家系统、自动程序设计、机器人、组合优化问题、人工神经网络、分布式人工智能与多智能体、智能控制、智能仿真、智能计算机系统、智能通讯、智能网络系统和人工生命等。
人工智能目前分为弱人工智能和强人工智能和超人工智能。
(1)弱人工智能:弱人工智能(ArtificialNarrow Intelligence /ANI),只专注于完成某个特定的任务,例如语音识别、图象识别和翻译等,是擅长于单个方面的人工智能。它们只是用于解决特定的具体类的任务问题而存在,大都是统计数据,以此从中归纳出模型。由于弱人工智能智能处理较为单一的问题,且发展程度并没有达到模拟人脑思维的程度,所以弱人工智能仍然属于“工具”的范畴,与传统的“产品”在本质上并无区别。
(2) 强人工智能:强人工智能(Artificial Generallnteligence /AGI),属于人类级别的人工智能,在各方面都能和人类比肩,它能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作,并且和人类一样得心应手。
(3)超人工智能:超人工智能(Artificial Superintelligence/ASI),在几乎所有领域都比最聪明的人类大脑都聪明许多,包括科学创新、通识和社交技能。在超人工智能阶段,人工智能已经跨过“奇点”,其计算和思维能力已经远超人脑。此时的人工智能已经不是人类可以理解和想象。人工智能将打破人脑受到的维度限制,其所观察和思考的内容,人脑已经无法理解,人工智能将形成一个新的社会。
目前我们仍处于弱人工智能阶段。
二、机器学习--一种人工智能方法
机器学习(MachineLearning)简称ML,就是研究如何使计算机具有类似于人的学习能力,使它能通过学习自动地获取知识。机器学习是一个难度较大的研究领域,属于人工智能的一个分支,也是人工智能的和核心,它与脑科学、神经心理学、计算机视觉、计算机听觉等都有密切的联系,依赖于这些学科的共同发展。
机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。机器学习方法主要有:
(1)有监督学习(Supeervised Learning),从给定的有标注的训练集中学习出一个函数(模型参数),当新的数据到来时可以根据这个函数预测结果。常见的任务包括分类和回归。
(2)无监督学习(Unsupervised Learning),没有标注的训练数据集,需要根据样本间的统计规律对样本进行分析。常见任务聚类。
(3)半监督学习(Semi-supervised Learning),结合(少量的)标注训练数据和(大量的)未标注数据来进行数据的分类学习。它存在聚类假设(整体)和流形假设(局部)这两个基本假设。
(4)增强学习(Reinforcement Learning),外部环境对输出只给出评价信息而非正确答案,学习机通过强化受奖励的动作来改善自身的性能。
(5)多任务学习(Multi-task Learning),把多个相关(related)的任务放在一起同时学习。
机器学习的一般过程有:
一、数据预处理(数据清洗、数据集成、数据采样)。
二、特征工程(特征编码、特征选择、特征降维、规范化)。
三、数据建模(回归问题、分类问题、聚类问题、其他问题)。
四、结果评估(拟合度量、查准率、查全率、F1值、PR曲线、ROC曲线)。
我们一般说的机器学习方法就是指在数学建模中所用的方法,主要有:
(1)分类问题。主要方法有决策树分类、贝叶斯分类、支持向量机、逻辑回归和集成学习。
(2)回归问题。主要方法有线性回归、岭回归和Lasso回归。
(3)聚类问题。主要方法有K-means、高斯混合聚类、密度聚类、层次聚类和谱聚类。
(4)其他问题。主要方法有隐马尔可夫模型、LDA主题模型、条件随机场、神经网络和深度学习。
三、深度学习--一种实现机器学习的技术
深度学习(DeepLearning)简称DL。它是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,如图象、声音、文本。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图象和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
深度学习是一类模式分析方法的统称,就具体研究内容而言,主要涉及三类方法:
(1)基于卷积运算的神经网络系统,即卷积神经网络(CNN)。
(2)基于多层神经元的自编码神经网络,包括自编码( Auto encoder)和稀疏编码( Sparse Coding)两类。
(3)以多层自编码神经网络的方式进行预训练,进而结合鉴别信息进一步优化神经网络权值的深度置信网络(DBN)。
深度学习主要应用并取得成果的领域:
(1)搜索技术
(2)数据挖掘
(3)机器学习
(4)计算机视觉
(5)机器翻译
(6)自然语言处理、语音识别
(7)推荐和个性化技术
(8)无人驾驶等
四、区别与联系
深度学习是机器学习的一种,而机器学习是实现人工智能的必经路径。 关系如下图:
图片来源于网络