2013年7月16日

摘要: PCA (Principle Component Analysis),主成分分析,是用的最广泛的数据预处理方法之一。同时PCA是一个almost always works的经典方法,基本上几乎所有的数据用PCA处理过以后再做后续的分类,往往会得到精度提升,不像很多其他方法只适用于某些数据而不适用于另一些数据。为什么PCA这么有效呢?我想主要是因为数据中普遍多多少少存在噪声,用PCA抽取主成分以后,噪声被滤除很多,使得分类变得更容易。另外,一些模型本身对数据空间有一些bias,用PCA做变换之后也会有影响,但这里的影响比较不确定。说回PCA本身,PCA的想法是把数据从原空间投影到一个低维空间,使 阅读全文
posted @ 2013-07-16 12:40 alexajia 阅读(2512) 评论(0) 推荐(2) 编辑

导航