1、引言
机器学*-计算机科学中软计算的子领域,从人工智能中的模式识别和计算学*理论研究演变而来。1959年,亚瑟·塞缪尔(Arthur Samuel)将机器学*定义为“一个研究领域,它赋予计算机无需明确编程就能学*的能力”。机器学*探索算法的研究和构建,这些算法可以从数据中学*并对数据进行预测。这种算法通过从输入观察的示例训练集构建模型来运行,以便进行数据驱动的预测或作为输出表示的决策,而不是严格遵循静态程序指令。
2、机器学*概念
机器学*是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学*”为重点的自然、清晰的脉络。显然,机器学*是实现人工智能的一个途径之一,即以机器学*为手段,解决人工智能中的部分问题。机器学*在*30多年已发展为一门多领域科际集成,涉及概率论、统计学、逼*论、凸分析、计算复杂性理论等多门学科。
机器学*理论主要是设计和分析一些让计算机可以自动“学*”的算法。机器学*算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学*算法中涉及了大量的统计学理论,机器学*与推断统计学联系尤为密切,也被称为统计学*理论。算法设计方面,机器学*理论关注可以实现的,行之有效的学*算法(要防止错误累积)。很多推论问题属于非程序化決策,所以部分的机器学*研究是开发容易处理的*似算法。
机器学*已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、游戏和机器人等领域。
3、机器学*是什么类型的东西?
一门学科
科学的一个分支
一门应用科学
计算机科学的一个分支
人工智能的一个分支
软计算的一个子领域
统计学的应用
4、机器学*的分类
机器学*可以分成下面几种类别:
(1)监督学*
监督学*从给定的训练数据集中学*出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学*的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学*算法包括回归分析和统计分类。
监督学*和非监督学*的差别就是训练集目标是否有人为标注。他们都有训练集 且都有输入和输出
(2)无监督学*
无监督学*与监督学*相比,训练集没有人为标注的结果。常见的无监督学*算法有生成对抗网络(GAN)、聚类。
半监督学*介于监督学*与无监督学*之间。增强学*机器为了达成目标,随着环境的变动,而逐步调整其行为,并评估每一个行动之后所到的回馈是正向的或负向的。
5、机器学*算法
具体的机器学*算法有:
- 构造间隔理论分布:聚类分析和模式识别
- 人工神经网络
- 决策树
- 感知器
- 支持向量机
- 集成学*AdaBoost
- 降维与度量学*
- 聚类
- 贝叶斯分类器
- 构造条件概率:回归分析和统计分类
- 高斯过程回归
- 线性判别分析
- 最*邻居法
- 径向基函数核
- 通过再生模型构造概率密度函数:
- 最大期望算法
- 概率图模型:包括贝叶斯网络和Markov随机场
- Generative Topographic Mapping
- *似推断技术:
- 马尔可夫链
- 蒙特卡罗方法
- 变分法
- 最优化:大多数以上方法,直接或者间接使用最优化算法。
- 量子机器学*