无监督算法

无监督算法：

KMeans算法：

1、随机初始化数据集簇的中心，一般从数据集中选择

2、外循环：

内循环：计算各个数值点到中心的距离，进行聚类

计算每个聚类的平局值，移动聚类中心

PCA算法：

目标：数据压缩和可视化

1、对样本数据进行去均值和归一化

2、组建sigma矩阵，然后进行奇异值分解，求的压缩和的结果Z

异常检测算法：

1、选择可能适应于异常样本的特征

2、根据样本得到高斯分布的均值和方差

3、对给定的样本计算其是否为异常样本

异常检测与监督学习：

异常检测：正样本数量较少（0-20）；大量的负样本

不同类型的正样本，很难从正样本中学的算法将其识别出来

未来会出现之前从未出现过的正样本，与当前的正样本无相似性

监督学习：有大量的正样本和负样本；

足够的样本支撑可以从中学到正样本的特征的检测算法

未来很难出现正样本中未出现过的样本

常见的异常检测和监督学习：

异常检测：欺诈行为/制造业/数据中心的监测

监督学习：垃圾邮件/天气/癌症

posted @ 2019-02-02 14:01 努力奋斗的阿贝拉阅读(1484) 评论(0) 收藏举报

刷新页面返回顶部

努力奋斗的阿贝拉