摘要: 如果数据集中缺失数据,将其替换成所属特征的平均值。假如文件forTest.txt中以下数据集: 加载和替换函数: 输出: 阅读全文
posted @ 2018-11-21 17:27 我的下铺刚田武 阅读(692) 评论(0) 推荐(0) 编辑
摘要: 数据集中含有太多特征时,需要简化数据。降维不是删除部分特征,而是将高维数据集映射到低维数据集,映射后的数据集更简洁,方便找出对结果贡献最大的部分特征。 简化数据的原因: 1、使得数据集更易使用 2、降低很多算法的计算开销 3、去除噪声 4、使得结果易懂 PCA:principal component 阅读全文
posted @ 2018-11-21 17:09 我的下铺刚田武 阅读(1539) 评论(0) 推荐(0) 编辑