摘要:
误差来自于偏差和方差(bias and variance) 对于随机变量 X,假设其期望和方差分别为 μ 和 σ2。随机采样 N 个随机变量构成样本,计算算术平均值 m,并不会直接得到 μ (除非采样无穷多个样本点)。 假设 m 和 s2 是样本均值和样本方差,由于样本都是随机抽取的,m 和 s2 阅读全文
摘要:
一、主要思想 利用正交变换把可能线性相关变量表示的观测数据,转换为由少数几个线性无关变量(主成分)表示的数据。(重构原始特征空间;线性降维) 要尽可能保留原始数据中的信息,两个思路:最大投影方差、最小投影距离。 完全的无监督,只需要通过方差来衡量信息量(但也是一种局限性)。各个主成分正交,降维后不同 阅读全文