摘要: 这篇文章主要讲解使用Sklearn进行数据预处理,我们使用Kaggle中泰坦尼克号事件的数据作为样本。 读取数据并创建数据表格,查看数据相关信息 表格内容如下所示 填充缺失值(数据预处理的第一步就是处理缺失值) 对于缺失值不多不少的数据特征,我们可以使用机器学习模型进行缺失值得填充,例如随机森林,逻 阅读全文
posted @ 2018-01-28 21:42 DUDUDA 阅读(714) 评论(0) 推荐(0) 编辑
摘要: 最近邻分类 概念讲解 我们使用的是scikit learn 库中的neighbors.KNeighborsClassifier 来实行KNN. n_neighbors 是用来确定多数投票规则里的K值,也就是在点的周围选取K个值最为总体范围 weights : 这个参数很有意思,它的作用是在进行分类判 阅读全文
posted @ 2018-01-28 18:16 DUDUDA 阅读(6854) 评论(0) 推荐(0) 编辑