机器学习概述

1.Python环境及pip list

 

pip list

 

 2.学习笔记

2.1什么是机器学习?

对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优值、大量的经验E,该程序对于任务T的性能逐步提高。

这里有三个重要的机器学习的对象:(1)任务Task,T,一个或者多个

                (2)经验Experience,E

                (3)性能Performance,P

即随着任务的不断执行,经验的积累会带来计算机性能的提升。

 

2.2机器学习的一般流程

(1)数据收集->(2)数据清洗->(3)特征工程->(4)数据建模

 

2.3机器学习的分类

 

 机器学习分为:有监督学习、无监督学习、强化学习

(1)有监督学习:即我们手动地给定一组数据,每一个数据的数型也给出,对于数据集的每个样本,我们想要算法预 测并给出正确答案。常见的监督学习算法是回归分析和统计分类,最典型的算法就是KNN和SVM。

(2)无监督学习:即数据是没有标签或者有相同的标签,我们不知道数据的含义和作用,只知道是有一个数据集。而无监督学习最常见的就是K-Means聚类分析算法。

(3)半监督学习:半监督学习的训练集中同时包含有标签数据和无标签数据,而为了让学习其不依赖外界教务、自动地利用未标记数据样本来提升学习能力。

(4)强化学习:强化学习最开始一般是采用随即策略去进行实验,然后得到各种状态、动作和奖励样本,之后算法根据所得样本来改进策略,使奖励最大化。

posted @ 2020-04-03 11:03  荔枝干  阅读(155)  评论(0编辑  收藏  举报