第二章 基于距离的分类器 笔记

MED分类器

基于距离的决策:把测试样本到每个类之间的距离作为决策模型,将测试样本判定为其距离最近的类。
判别公式:y ∈ Ci if d(y, Ci) <= d(y, Cj) any j != i

常见的几种距离度量:

MED分类器(最小欧式距离分类器):
距离衡量:欧式距离
类的原型:均值
决策边界:

缺点:没有考虑特征变化的不同及特征之间的相关性
解决方法:去除特征变化的不同及特征之间的相关性

特征白化

目的:将原始特征映射到一个新的特征空间,使得在新空间中特征的协方差矩阵为单位矩阵,从而去除特征变化的不同及特征之间的相关性。
假设映射矩阵为:

转换后的特征y为:

转换后的协方差矩阵为:

目标:

令 W = W1 * W2
解耦:通过 W1 实现协方差矩阵对角化,去除特征之间的相关性。
白化:通过 W2 对上一步变化后的特征再进行尺度变换,实现所有特征具有相同方差。

特征解耦:

特征白化:

W转换后的距离:

MICD分类器

MICD分类器(最小类内距离分类器):
度量距离:马氏距离
类的原型:均值
判别公式:

决策边界:


posted @ 2020-05-04 17:03  1e9+7  阅读(460)  评论(0编辑  收藏  举报