摘要: 降维的两种方式 特征选择 主成分分析(可以理解一种特征提取的方式) 降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 特征选择:数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征。 Filter(过滤式):主要探究特征本身特点、特征与 阅读全文
posted @ 2021-05-25 17:38 纵横捭阖行 阅读(461) 评论(0) 推荐(0) 编辑
摘要: 为什么我们要进行归一化/标准化? 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征 我们需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格 归一化: from sklearn.preprocessing 阅读全文
posted @ 2021-05-25 17:14 纵横捭阖行 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 2.1 数据集 Kaggle网址:https://www.kaggle.com/datasets UCI数据集网址: http://archive.ics.uci.edu/ml/ scikit-learn网址:http://scikit-learn.org/stable/datasets/index 阅读全文
posted @ 2021-05-25 16:58 纵横捭阖行 阅读(63) 评论(0) 推荐(0) 编辑