摘要:
如果数据集中缺失数据,将其替换成所属特征的平均值。假如文件forTest.txt中以下数据集: 加载和替换函数: 输出: 阅读全文
摘要:
数据集中含有太多特征时,需要简化数据。降维不是删除部分特征,而是将高维数据集映射到低维数据集,映射后的数据集更简洁,方便找出对结果贡献最大的部分特征。 简化数据的原因: 1、使得数据集更易使用 2、降低很多算法的计算开销 3、去除噪声 4、使得结果易懂 PCA:principal component 阅读全文