初识Machine Learning
What is Machine Learning
定义
Arthur Samuel:Field of study that gives computers the ability to learn without being explicitly programmed(在没有被明确编程的情况下,赋予计算机学习能力的学习领域)。
Tom Mitchell:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E(计算机程序从经验E中学习在某一性能度量P下解决某一任务T,因为经验E,它在解决T时的性能,以P来衡量,有所提升)。
Machine Learning 分类:
-
Supervised Learning(监督学习)
从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数来预测结果。监督学习的训练集要求是输入和输出,也可以说是特征和目标。训练集中的目标是人为标注的。常见的监督学习算法包括回归和分类。 -
Unsupervised Learning(无监督学习)
无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类等。 -
Semi-supervised Learning(半监督学习)
这是一种介于监督学习与无监督学习之间的方法。 -
Transfer Learning(迁移学习)
将已经训练好的模型参数迁移到新的模型来帮助新模型训练数据集。 -
Reinforcement Learning(增强学习)
通过观察周围环境来学习。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。
传统的机器学习算法有以下几种:线性回归模型、logistic回归模型、k-临近算法、决策树、随机森林、支持向量机、人工神经网络、EM算法概率图模型等。