摘要: 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 在数据挖掘工作中,通常处理的是一个包含大量特征且含义未知的数据集,并基于该数据集挖掘到有用的特征。那么 阅读全文
posted @ 2018-11-15 17:32 静悟生慧 阅读(922) 评论(0) 推荐(0) 编辑
摘要: pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数、Kendall Tau相关系数和spearman秩相关)。 >>> import numpy as np>>> import pandas as pd 阅读全文
posted @ 2018-11-15 15:52 静悟生慧 阅读(14416) 评论(0) 推荐(0) 编辑