2011年1月22日

特征向量的归一化方法

摘要: 在使用KNN(k-Nearest Neighbours)根据特征值进行分类的时候,如果所有变量位于同一值域范围内,利用这些变量一次性算出距离值是有意义的。不过,假设我们引入一个对最终的分类结果产生影响的新变量(不同类型的变量 Heterogenous Varibales)。与我们目前使用过的变量不同(假设之前的变量的取值均介于0和100之间),这些变量可能会达到1000。很显然,和原先的变量相比,这个新的变量对距离计算所产生的影响更为显著——其影响将超过任何其他变量对距离计算所构成的影响,这意味着,在计算距离的过程中其他变量根本就未被考虑在内。 (摘自《Programming Collecti 阅读全文

posted @ 2011-01-22 15:08 Lowtec 阅读(21000) 评论(2) 推荐(3) 编辑

导航