摘要: 一:目的 数据归一化(标准化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。 二:分为 阅读全文
posted @ 2019-04-07 16:22 Coding_Now 阅读(1071) 评论(0) 推荐(0) 编辑
摘要: 主要用到 sklearn.model_selection包下的GridSearchCV类。 总共分为几步: a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSearchCV对象 d.进行数据训练 e.得出最优超参数 a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSear 阅读全文
posted @ 2019-04-07 15:33 Coding_Now 阅读(975) 评论(0) 推荐(0) 编辑
摘要: 一:定义 超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。 二:常用超参数 k近邻算法的k,权重weight,明可夫斯基距离公式的p,这三个参数都在KNeighborsClassifier类的构造函数中。 三:共同代码 四:k的最优数值 五:weight的最优数值 如果取值为u 阅读全文
posted @ 2019-04-07 12:39 Coding_Now 阅读(3695) 评论(0) 推荐(1) 编辑
摘要: 本章,我们使用sklearn自带的手写识别的数据集进行计算准确度,进而巩固之前学的KNN算法。 本节主要是进行之前学的KNN算法进行巩固,进而为后续的学习打好基础。 阅读全文
posted @ 2019-04-07 10:17 Coding_Now 阅读(812) 评论(0) 推荐(0) 编辑