[模式识别复习笔记] 第6章 PCA
1. 主成分分析 PCA
PCA:寻找最能够 表示 原始数据的投影方法,对数据进行降维,除去冗余的信息。——不考虑类别
1.1 PCA 主要步骤
-
计算 散布矩阵
(或者样本的协方差矩阵)其中
。 -
由
计算 的 特征值 和 特征向量 。 也称为主成分,任意两个主成分 正交,且 ; -
按照特征值 从大到小 将对应的特征向量进行排序;
-
选择 特征值前
大 的特征向量作为投影向量,构成特征向量矩阵 ,是一个标准正交矩阵; -
对于任意的
维样本 ,用 降维后的 维向量为:
最大的几个特征值占据了所有特征值之和的绝大部分。将数据投影到少数几个最大特征值对应的特征向量方向上即可保留原数据中的绝大部分信息。样本投影到主成分上方差越大越能表明这个主成分能够更好地区分样本。

1.2 PCA 的几何解释

1.3 例题
例题 1
给定
请分析在
解:
不产生影响。
设
由于散布矩阵是协方差矩阵的
也即:
相当于
因此,协方差矩阵和散布矩阵下的
例题 2
设原始数据集
请证明
解:
-
计算
个投影点的均值 : -
计算
个投影点的方差:其中
为协方差矩阵:由
中 ,其中 为第 大的特征值,故:由于
,得: -
由上述结论可得,所有样本在第
个主成分上得投影点得方差为 ,而 是所有特征值中最大的。故
第一主成分就是所有样本投影到该方向上的投影点的方差最大的方向。
2. Fisher 线性判别分析 FDA
Fisher线性判别分析(FDA):寻找的是 能够有效分类 的方
向,是 有监督的降维方法。

一切都是命运石之门的选择,本文章来源于博客园,作者:MarisaMagic,出处:https://www.cnblogs.com/MarisaMagic/p/18260615,未经允许严禁转载
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」