随笔分类 - python 小白学习 pandas ------ 基于python机器学习
摘要:导入葡萄酒数据: 运行结果: 划分训练集和测试集: 我们可以使用 sklearn.model_selection 中的 train_test_split 划分数据,test_size用来设置测试数据的比例,random_state用来 设置随机数是否保持一致。 这里如果你用的是 sklearn.cr
阅读全文
摘要:生成类标数据: 运行结果: 有序特征的映射: 运行结果: 可以通过size_mapping映射回去 运行结果: 类标的编码: 可以简单地从0开始设置类标 运行结果: 同样我们可以使用键值对倒置还原类标 使用scikit-learn中的LabelEncoder类完成类标的编码 遇到警告可以使用下面的代
阅读全文
摘要:做数据分析挖掘特征之前,都要先处理好数据,数据处理里第一步我们要先处理有缺失值的情况。 查看导入的数据缺失情况: 通过打印的输出我们可以发现使用 isnull方法可以判断值是否为空,isnull().sum()方法按列输出缺失值的个数。 我们可以利用数据框(DataFrame)的values属性来获
阅读全文