监督学习，无监督学习，半监督学习区别

监督学习：

监督学习是目前最主流的学习方式，其特点是：训练过程中样本都是有标签的。

常见的监督学习任务有：分类、回归、序列标注等。

学习步骤大致可以分为三步（以SVM为例）：

1) 在有监督数据上训练，学的一个判别器W；

2）然后在测试集（故意把标签P抹去）上，用上一步学的判别器W进行分类任务，得到一个预测标签PY

3) PY和P的差距，就是衡量算法好坏的标准。

特点是：训练过程中没有样本标签。

常见的任务：聚类、降维等

常用算法：k-means、谱聚类等

步骤：

1）直接在全部数据上训练，得到预测标签PY

2) 之后将PY和真实标签Y进行对比，用的是经典的匈牙利算法。

注意：这里的PY和Y并不是一一对应关系，而是看“类内样本”对应关系，这也是聚类指标和分类指标不同之处。

举个例子：样本A和样本B真实标签是“1”

经过聚类算法处理后，得到了预测标签。若A、B标签相同，则代表这两个样本分对了（标签可能是“1”，也可能是“2”、“3”、“4”、、、）

若聚类后，A和B的标签不同，则代表这两个样本分错了（分成不同类了）。

特点是：训练过程中，用的是全部的样本数据（和监督的区别，监督是认为的把数据划分为有标签和无标签），但是这些样本中只有一小部分有标签，大部分是没有标签的。

其原理是通过标签传播的方式，利用已有标签的样本信息去预测未知标签样本的类别信息。

典型方法：S3VM、S4VM、CS4VM、TSVM；

posted @ 2020-06-10 15:34 派大星1号阅读(2376) 评论(0) 收藏举报

刷新页面返回顶部