摘要: 假设你有一些数据如下图 这时,给一个新的数据,我们认为这个数据和原来的数据差距不大,因此认为这个数据时正常的 对于下图所示的新数据,我们认为它是“异常点”,因为它距离其他数据较远 一般情况下 异常检测的训练数据集都是正常/都是不正常的数据 然后判断测试数据是否是异常数据 异常检测方法: 根据无标签的 阅读全文
posted @ 2018-11-04 20:49 qkloveslife 阅读(1466) 评论(0) 推荐(0) 编辑
摘要: 运用二维降维到一维的例子帮助理解 对于如下二维数据 PCA算法会试图寻找一条直线使得所有数据到这个直线的距离的平方和最小(”投影误差“最小)(图中所有蓝色线长度的平方和)(注意:做PCA之前需要将数据进行标准化,将数据映射到(0,1)区间内) 对于以下两种情况,PCA会选择红色线 更书面的表达 Re 阅读全文
posted @ 2018-11-04 12:51 qkloveslife 阅读(599) 评论(0) 推荐(0) 编辑
摘要: 为什么要降维? 维数少可以使算法有更快的计算速度,减少机器内存占用等 多个特征携带的“信息”有相同或类似的情况(冗余) 用于数据可视化 如何降维? 简单的例子,对于二位数据 可以找到一条线 将所有的数据映射到这条线上 然后用映射后的一维数据去代表二位数据 三维降维到二维的例子,假设数据如下 这时,表 阅读全文
posted @ 2018-11-04 11:08 qkloveslife 阅读(1501) 评论(0) 推荐(0) 编辑