摘要:
将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。离散特征进行one-hot编码后,编码后的特征,其实每一维度的特征都可以看做是连续的特征。就可以跟对连续型特征的归一化方法一样,对每一维特征进行归一化。 from sklearn.preprocessing import OneHo 阅读全文
摘要:
SELECT tmp.employee_name, tmp.stat_month, count( DISTINCT tmp.signature ) signature_cnt, count( DISTINCT tmp.signature_api ) signature_api_cnt, count( 阅读全文