摘要: 大多数数据挖掘或数据工作中,异常值都会在数据的预处理过程中被认为是“噪音”而剔除,以避免其对总体数据评估和分析挖掘的影响。但某些情况下,如果数据工作的目标就是围绕异常值,那么这些异常值会成为数据工作的焦点。 数据集中的异常数据通常被成为异常点、离群点或孤立点等,典型特征是这些数据的特征或规则与大多数 阅读全文
posted @ 2021-07-28 21:53 常给自己加个油 阅读(1038) 评论(0) 推荐(1) 编辑
摘要: 马氏距离就是将数据做了旋转,做了方差归一化之后再计算的欧氏距离 马氏距离在欧式距离的基础上增加了(公司中x、u表示两个不同的变量): 1. (xi-uj),欧式距离只有(xi-uj),即相同下标的x-u的乘积2. (xi-ui)(xj-uj)的前面增加了一个系数,这个系数是xi和ui的协方差(协方差 阅读全文
posted @ 2021-07-28 20:36 常给自己加个油 阅读(3258) 评论(0) 推荐(0) 编辑