机器学习概述
1.Python环境及pip list
pip list
2.学习笔记
2.1什么是机器学习?
对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优值、大量的经验E,该程序对于任务T的性能逐步提高。
这里有三个重要的机器学习的对象:(1)任务Task,T,一个或者多个
(2)经验Experience,E
(3)性能Performance,P
即随着任务的不断执行,经验的积累会带来计算机性能的提升。
2.2机器学习的一般流程
(1)数据收集->(2)数据清洗->(3)特征工程->(4)数据建模
2.3机器学习的分类
机器学习分为:有监督学习、无监督学习、强化学习
(1)有监督学习:即我们手动地给定一组数据,每一个数据的数型也给出,对于数据集的每个样本,我们想要算法预 测并给出正确答案。常见的监督学习算法是回归分析和统计分类,最典型的算法就是KNN和SVM。
(2)无监督学习:即数据是没有标签或者有相同的标签,我们不知道数据的含义和作用,只知道是有一个数据集。而无监督学习最常见的就是K-Means聚类分析算法。
(3)半监督学习:半监督学习的训练集中同时包含有标签数据和无标签数据,而为了让学习其不依赖外界教务、自动地利用未标记数据样本来提升学习能力。
(4)强化学习:强化学习最开始一般是采用随即策略去进行实验,然后得到各种状态、动作和奖励样本,之后算法根据所得样本来改进策略,使奖励最大化。