1.机器学习介绍
1. 什么是机器学习?
Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
Arthur Samuel (1959) 机器学习:赋予计算机学习能力而无需明确编程的研究领域
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
Tom Mitchell(1998)定义一个学习问题:如果一个计算机程序在任务T上的表现(如P所衡量的)随着经验E的增加而提高,那么它可以从经验E中学习关于某个任务T和某个性能度量P的知识
机器学习算法:
-
监督学习
我们教会计算机某项能力
-
无监督学习
计算机自己学会某项能力
2. 监督学习
我们给算法一个数据集,其中包含了正确的答案
在监督学习中,对于数据集的每个样本,想要算法预测,并给出“正确的答案”。
回归问题:
我们的目标是预测一个连续值输出
分类问题:
我们的目标是预测离散值输出
3. 无监督学习
我们得到一个数据集,没有标签或者都具有相同的标签,
不知道要拿它来做什么,也不知道每个数据点究竟是什么,
我们只被告知之有一个数据集,你能在其中找到某种结构吗?
对于给定的数据集,无监督学习算法
可能判定该数据集包含两个不同的簇。无监督学习算法可以把这些数据
分成两个不同的簇,这就是聚类算法。