摘要:
一、背景介绍 现实生活许多例子只有正样本和大量未标记样本,这是因为获取负类样本较为困难、负类数据太过多样化且动态变化。比如在推荐系统,用户点击为正样本,却不能因为用户没有点击就认为它是负样本,因为可能样本的位置很偏,导致用户没有点击。 PU Learning(Positive-unlabeled l 阅读全文
摘要:
在中等高维数据集上执行异常值检测的另一种有效方法是使用局部异常因子(Local Outlier Factor ,LOF)算法。1、算法思想LOF通过计算一个数值score来反映一个样本的异常程度。这个数值的大致意思是:一个样本点周围的样本点所处位置的平均密度比上该样本点所在位置的密度。比值越大于1, 阅读全文