2019 年 4月 7 日随笔档案 - Coding_Now

2019年4月7日

摘要：一：目的数据归一化（标准化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。二：分为阅读全文

posted @ 2019-04-07 16:22 Coding_Now 阅读(1071) 评论(0) 推荐(0) 编辑

KNN算法网格搜索最优参数

摘要：主要用到 sklearn.model_selection包下的GridSearchCV类。总共分为几步： a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSearchCV对象 d.进行数据训练 e.得出最优超参数 a.创建训练集和测试集 b.创建最优参数字典 c.构建GridSear 阅读全文

posted @ 2019-04-07 15:33 Coding_Now 阅读(975) 评论(0) 推荐(0) 编辑

KNN算法的超参数

摘要：一：定义超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。二：常用超参数 k近邻算法的k，权重weight，明可夫斯基距离公式的p，这三个参数都在KNeighborsClassifier类的构造函数中。三：共同代码四：k的最优数值五：weight的最优数值如果取值为u 阅读全文

posted @ 2019-04-07 12:39 Coding_Now 阅读(3695) 评论(0) 推荐(1) 编辑

机器学习算法的分类准确度

摘要：本章，我们使用sklearn自带的手写识别的数据集进行计算准确度，进而巩固之前学的KNN算法。本节主要是进行之前学的KNN算法进行巩固，进而为后续的学习打好基础。阅读全文

posted @ 2019-04-07 10:17 Coding_Now 阅读(812) 评论(0) 推荐(0) 编辑

Code_exploration

程序人生，走向人生巅峰

公告