摘要:
##分类准确度 分类准确度 以sklearn中的手写数字datasets.load_digits为例,其是8*8的图形,具有64个特征值,类别由0到9 我们挑选出666这个图形,将其可视化 X = digits.data some_digit = X[666] some_digit_image = 阅读全文
摘要:
##KNN算法(3) 测试算法的目的就是为了帮助我们选择一个更好的模型 训练数据集,测试数据集方面 一般来说,我们训练得到的模型直接在真实的环境中使用 这就导致了一些问题 如果模型很差,未经改进就应用在现实环境下,那这样得到的预测结果必然是不好的,而且在真实环境中,是难以拿到真实的label(输出结 阅读全文
摘要:
##KNN算法(2) 机器学习算法封装 scikit-learn中的机器学习算法封装 在python chame中将算法写好 import numpy as np from math import sqrt from collections import Counter def kNN_classi 阅读全文
摘要:
##KNN算法(1) 全称是K Nearest Neighbors k近邻算法: 思想简单 需要的数学知识很少 效果不错 可以解释机器学习算法使用过程中的很多细节问题 更加完整的刻画机器学习应用的流程 其思想总的来说就是在多个样本之间进行比较,越相似的话,新的样本就有更高的概率属于这个类别,一般用来 阅读全文
摘要:
##将onenote快速复制粘贴到博客园后台 开始的时候用OneNote记笔记,没想到复制粘贴下来的竟然是图片 导致写的东西想要放上来都得手打 网上好多都是让下一个插件之类的 其实原始一点,用记事本直接全部复制下来就行 首先 在OneNote点击上面的四个点就可以全选了 直接在记事本中粘贴,文字部分 阅读全文
摘要:
##关于解决numpy使用sklearn时的警告问题 在使用的时候,出现提示 :219: RuntimeWarning: numpy.ufunc size changed, may indicate binary incompatibility. Expected 192 from C header 阅读全文
摘要:
##读取数据以及简单的数据探索 读取数据与简单的数据探索 可以通过sklearn中的各种数据集来练手 以下是iris鸢尾花的全部数据信息及对应的情况 若想打印出全部情况(含有的属性) print(iris.DESCR) Iris.data全部数据 Iris.feature_names全部代表的名称 阅读全文
摘要:
##matplotilb基础 matplotilb是我们使用的一个基础的可视化方法 一般来说,使用matplotilb是较为专业的绘制图形的选择 不需要很专业的时候可以只是用matplotilb的子模块pyplot 首先我们先设置一个x,一个y 以x为横坐标,以y为纵坐标 通过plot(x,y)就可 阅读全文
摘要:
##numpy.array的基本运算以及对数据的操作 设置一个问题,例如 这种只需要基本的运算就可以实现 类似的 numpy对向量的运算进行了优化,速度是相当快的,这种被称为universal functions 可以使用+,-,,/,//, *(两个星号),%,1/(/表示浮点除,//表示整数除, 阅读全文
摘要:
##numpy数组的合并与分割 ###合并操作 concatenate拼接,只能操作维数一样的数据 且并不局限于两个元素 对于二维数组来说,可以通过控制axis来控制是按照行还是按照列来进行拼接操作,默认为axis=0,垂直方向 想要统一维数,可以使用reshape,记得赋值保存 Vstack(垂直 阅读全文