摘要: 监督学习,过滤,特征加权第一个问题就是,怎样定义一个"好的"的特征?首先我们尊重数据,数据是大爷,所以一个好的特征得到的结果应该和数据相吻合。即如果原数据中两点相近,那么在该特征下两点也应该相近。其次,好的特征应该能将类之间分开,那么如果一个特征的跨度越到,我们认为这个特征就就具有好的分类特性,衡量这个跨度的就是方差,所以就要有一个大的方差。Laplacian score 的方法这样定义一个特征的权重值,其中其中t 为一个给定值为什么会有Sij?我认为Sij 度量的是Xi 和Xj 之间的距离,所以就为分析某一个特性的时候带入了整体感……下面再化简根据一个叫做spectral 阅读全文
posted @ 2012-05-21 15:27 chend926 阅读(1890) 评论(1) 推荐(0) 编辑