异常检测的例子:
如飞机引擎的两个特征:产生热量与振动频率,我们有m个样本画在图中如上图的叉叉所示,这时来了一个新的样本(xtest),如果它落在上面,则表示它没有问题,如果它落在下面(如上图所示),表示这个样本有些问题,在把它交付给客户之前,我们需要对它做进一步的检测。
对异常检测一般化的描述:
我们有m个正常的样本,来了一个新的样本xtest,我们需要检测它是否异常???
→我们的方法是根据这m个正常的样本,来建立一个模型p(x),即对x的分布概率建模
→建好模型后,根据这个模型p(x)来看新的需要检测的数据xtest,根据P(xtest)是否小于一个阀值(ε)来判断它是否为异常(anomaly)
→这样会发现靠近中心点的p(x)值会大些,远离中心点的p(x)的值会小,为异常点。
异常检测的一些应用
欺诈检测:如用x来表示用户的一系列行为,如x1表示用户登陆的次数,x2表示用户访问某个网页的次数,x3用来表示用户提交的次数等等,通过对这些用户的行为进行建模来检测异常用户,这些异常用户不仅仅是被盗号的用户,而是行为有异常的用户。
工业生产领域:如找到异常的飞机引擎,进一步细查这些引擎的质量。
数据中心的计算机监控:数据中心或者计算机集群,根据机器的一些使用情况,如内存使用量、硬盘访问量、CPU载量等来建模p(x),当检测到某台计算机有异常时(p(x)<ε)需要对其做进一步的检查。