摘要: 机器学习一百天-day7/11-KNN近邻法 在协同过滤里应用的就是近邻法 一,数据预处理 读取数据,划分数据集,特征归一化 二,将KNN应用于训练集 使用KNeighborsClassifier, 具体介绍见https://scikit-learn.org/stable/modules/gener 阅读全文
posted @ 2019-01-16 12:17 forthlss 阅读(234) 评论(1) 推荐(0) 编辑
摘要: 机器学习100天-day4,5,6,8逻辑回归 一,数据导入 将类别变量转为哑变量 检测是否有nan值 划分数据集 将X的数据进行归一化处理 二,逻辑回归模型 三,评估预测 生成混淆矩阵 混淆矩阵(confusion matrix)是机器学习尤其是统计分类中常用的用以判断分类好坏的方法,如下: TP 阅读全文
posted @ 2019-01-16 11:30 forthlss 阅读(316) 评论(1) 推荐(0) 编辑
摘要: 机器学习一百天-day3多元线性回归及虚拟变量陷阱分析 一,数据预处理 导入数据集 数据集(head(5)): 将类别数据数字化 先用labelencoder将字符串编码为0,1,2,再用onrhotencoder编码 此时的X : [[0.0000000e+00 0.0000000e+00 1.0 阅读全文
posted @ 2019-01-16 11:28 forthlss 阅读(1161) 评论(1) 推荐(0) 编辑