2020年8月19日
摘要: 文章转载于:https://www.cnblogs.com/jiaxin359/p/8615502.html 数据可视化可以帮助我们理解数据:查看数据的分布情况,观察有没有异常值,各个变量之间的相关情况。 当我们进行数据可视化的时候,我们要紧紧围绕着这个变量和我们的目标变量之间的关系,在绘制大多数图 阅读全文
posted @ 2020-08-19 17:11 小小喽啰 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 目录 移除方差较低的特征 VarianceThreshold方法 单变量特征选择 回归特征消除 基于L1正则化的特征选择(线性模型的特征选择) 基于树结构的特征选择 特征选择 特征选择是从数据集的诸多特征里面选择和目标变量相关的特征,去掉那些不相关的特征。 特征选择分为两个问题:一个是子集搜索问题, 阅读全文
posted @ 2020-08-19 15:53 小小喽啰 阅读(415) 评论(0) 推荐(0) 编辑
摘要: reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的DataFrame和Series结构。reshape用来更改数据的列数和行数reshape(行,列)可以根据指定的数值将数据转换为特定的行数和列数;那么reshape(1,-1)或者reshape(-1,1) 阅读全文
posted @ 2020-08-19 10:54 小小喽啰 阅读(1738) 评论(0) 推荐(0) 编辑