摘要:
多元高斯分布(multivariate gaussian distribution)有一些优势也有一些劣势,它能捕获一些之前算法检测不出来的异常 一个例子:为什么要引入多元高斯分布 使用数据中心监控机器的例子,有两个features,x1:CUP Load, x2:Memory Use.将这两个fe 阅读全文
摘要:
如何构建与选择异常检测算法中的features 如果我的feature像图1所示的那样的正态分布图的话,我们可以很高兴地将它送入异常检测系统中去构建算法。 如果我的feature像图2那样不是正态分布的话,虽然我们也可以很好的运行算法,但是我们通常会使用一些转换方法,使数据看下来更像高斯分布,这样算 阅读全文
摘要:
异常检测算法先是将一些正常的样本做为无标签样本来学习模型p(x),即评估参数,然后用学习到的模型在交叉验证集上通过F1值来选择表现最好的ε的值,然后在测试集上进行算法的评估。这儿用到了带有标签的数据,那么为什么不直接用监督学习对y=1和y=0的数据进行学习呢?而是要用到异常检测算法(先对无标签数据进 阅读全文