摘要:
特征选择原因: 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对预测结果有影响 一,特征选择(过滤式) 删除低方差的特征 特征选取代码如下: from sklearn.feature_selection import VarianceThreshold def var(): """ 特征 阅读全文
摘要:
一,归一化 处理不同特征之间数据相差不是太大的问题。 特征1 特征2 特征3 特征4 80 2 10 30 40 4 15 40 30 3 12 45 以计算80这个位置进行转换为例,特征1这一列 x‘=(80-30)/(80-30)=1 x''=1*(1-0)+0=1 故80转换化为x''=1 其 阅读全文