摘要: ##scikit-learn中的数据归一化 在机器学习使用数据归一化的时候有一个重要的注意事项 我们对训练数据进行均值和方差的处理,得到mean_train以及std_train,但是在对测试数据进行归一化的时候,是不能直接用测试数据的均值和方差来进行归一化的,应该使用训练数据的均值和方差对测试数据 阅读全文
posted @ 2021-01-14 15:53 DbWong_0918 阅读(793) 评论(0) 推荐(0) 编辑
摘要: ##数据归一化 feature scaling 在分类的时候需要进行数据归一化 那么为什么要进行数据归一化? 像是肿瘤情况,当时间单位是天,大小单位是厘米,由于时间的跨度比大小的跨度差值大的太多,会导致样本间的距离被时间所主导,同理,将时间变成以年为单位一样会因为差值太大而导致模型不行 所谓的数据归 阅读全文
posted @ 2021-01-14 15:47 DbWong_0918 阅读(958) 评论(0) 推荐(0) 编辑
摘要: ##KNeighborsClassifier()的参数无效错误 写在前面:如果对自己英语拼写很自信,可以不用往下看了,我就是拼写错误 错误提示 Invalid parameter n_neightbors for estimator KNeighborsClassifier(). Check the 阅读全文
posted @ 2021-01-14 12:59 DbWong_0918 阅读(2410) 评论(1) 推荐(0) 编辑
摘要: ##网格搜索与k近邻算法中更多超参数 网格搜索与k近邻算法中更多超参数 ###网络搜索 前笔记中使用的for循环进行的网格搜索的方式,我们可以发现不同的超参数之间是存在一种依赖关系的,像是p这个超参数,只有在 weights="uniform"才有意义 在sklearn中有一种封装好的网格搜索,gr 阅读全文
posted @ 2021-01-14 12:50 DbWong_0918 阅读(770) 评论(0) 推荐(0) 编辑
摘要: ##超参数 超参数 很多时候,对于算法来说,关于这个传入的参数,传什么样的值是最好的? 这就涉及到了机器学习领域的超参数 超参数简单来说就是在我们运行机器学习之前用来指定的那个参数,就是在算法运行前需要决定的参数 像是knn算法中的k就是典型的超参数 同时,还有一种是模型参数,即在算法过程中学习的参 阅读全文
posted @ 2021-01-14 12:43 DbWong_0918 阅读(881) 评论(0) 推荐(0) 编辑
摘要: ##ImportError: attempted relative import with no known parent package ImportError: attempted relative import with no known parent package 截图: 或许是因为同文件 阅读全文
posted @ 2021-01-14 12:32 DbWong_0918 阅读(213) 评论(0) 推荐(0) 编辑
摘要: ##分类准确度 分类准确度 以sklearn中的手写数字datasets.load_digits为例,其是8*8的图形,具有64个特征值,类别由0到9 我们挑选出666这个图形,将其可视化 X = digits.data some_digit = X[666] some_digit_image = 阅读全文
posted @ 2021-01-14 12:29 DbWong_0918 阅读(1542) 评论(0) 推荐(0) 编辑
摘要: ##KNN算法(3) 测试算法的目的就是为了帮助我们选择一个更好的模型 训练数据集,测试数据集方面 一般来说,我们训练得到的模型直接在真实的环境中使用 这就导致了一些问题 如果模型很差,未经改进就应用在现实环境下,那这样得到的预测结果必然是不好的,而且在真实环境中,是难以拿到真实的label(输出结 阅读全文
posted @ 2021-01-13 21:44 DbWong_0918 阅读(129) 评论(0) 推荐(0) 编辑
摘要: ##KNN算法(2) 机器学习算法封装 scikit-learn中的机器学习算法封装 在python chame中将算法写好 import numpy as np from math import sqrt from collections import Counter def kNN_classi 阅读全文
posted @ 2021-01-13 21:33 DbWong_0918 阅读(167) 评论(0) 推荐(1) 编辑
摘要: ##KNN算法(1) 全称是K Nearest Neighbors k近邻算法: 思想简单 需要的数学知识很少 效果不错 可以解释机器学习算法使用过程中的很多细节问题 更加完整的刻画机器学习应用的流程 其思想总的来说就是在多个样本之间进行比较,越相似的话,新的样本就有更高的概率属于这个类别,一般用来 阅读全文
posted @ 2021-01-13 21:22 DbWong_0918 阅读(159) 评论(0) 推荐(1) 编辑