摘要:
当特征和目标变量不是很相关时,可以修改输入的数据集,应用线性,非线性变换(或者其他相似方法)来提高系统的精度。 - 数据是“死”的,人的思维是“活”的。 - 数据科学家负责改变数据集和输入数据,使数据更好的符合分类模型。 基本方法:A. 特征的线性修正 B. 特征的非线性修正 K近邻方法(K-Nea 阅读全文
摘要:
数据加载和数据预处理: (1)利用Pandas库进行数据加载和预处理:处理问题数据,日期格式解析,NaN值的处理,分组和聚类,排序和索引,文本数据的编码,词频统计等; (2)利用Numpy库进行数据处理:数组的创建,矩阵运算,数组切片,堆叠等。 数据分析: (1)数据的探索性分析; (2)高维数据的 阅读全文