第二章 基于距离的分类器

预习笔记

MED分类器

  • 基于欧式距离的分类器,欧式距离 \(d(x1,x2)=(x2-x1)^{T}*(x2-x1)\)
  • 判别方法: \((x-μ_{1})^{T}(x-μ_{1})<(x-μ_{2})^{T}(x-μ_{2})? C1类 : C2类\)
  • 受特征的量纲、分布不同的影响,易导致分类错误,一般不直接用欧式距离进行分类

MICD分类器

  • 基于马氏距离的分类器,马氏距离 \(d(x1,x2)=(x2-x1)^{T}Σ_{x}^{-1}(x2-x1)\)
  • 判别方法:\((x-μ_{1})^{T}Σ_{x}^{-1}(x-μ_{1})<(x-μ_{2})^{T}Σ_{x}^{-1}(x-μ_{2})?C1类:C2类\)
  • 针对欧式距离出现的问题,对特征进行解耦与白化,转化后的点间距离为马氏距离
  • 消除了特征间的相关性并使特征具有相同方差,从而使其不受量纲和分布的影响,提高分类准确度
  • 但在距离相等时,倾向于归于方差较大的类

复习笔记

MED分类器

类的原型

用来代表这个类的一个模式或者一组量,便于计算该类和测试样本之间的距离。

均值

最近邻

几种常见的距离度量

MED分类器

  • 概念:最小欧式距离分类器(Minimum Euclidean Distance Classifier)
  • 距离衡量:欧式距离
  • 类的原型:均值
  • 决策边界: $ (x-μ_{1})^{T} (x-μ_{1}) - (x-μ_{2})^{T} (x-μ_{2}) = 0 $
  • 判别公式: \((x-μ_{1})^{T}(x-μ_{1})<(x-μ_{2})^{T}(x-μ_{2})? C1类 : C2类\)
  • 缺陷:易受特征量纲和分布的影响

特征白化

令W=W1W2,目标使 $ W Σ_{x} W^{T} = I $

解耦

通过W1实现协方差矩阵对角化,去除特征之间的相关性。

白化

通过W2对上一步变换后的特征再进行尺度变换,实现所有特征具有相同方差。

马氏距离

MICD分类器

  • 最小类内距离分类器(Minimum Intra-class DistanceClassifier),基于马氏距离的分类器。
  • 距离度量:马氏距离
  • 类的原型:均值
  • 决策边界:\((x-μ_{1})^{T}Σ_{x}^{-1}(x-μ_{1})-(x-μ_{2})^{T}Σ_{x}^{-1}(x-μ_{2})=0\)
  • 判别公式:\((x-μ_{1})^{T}Σ_{x}^{-1}(x-μ_{1})<(x-μ_{2})^{T}Σ_{x}^{-1}(x-μ_{2})?C1类:C2类\)
  • 缺陷:均值相同时,会选择方差较大的类
posted @ 2020-05-05 12:52  __orange  阅读(1297)  评论(0编辑  收藏  举报