摘要: ##KNN算法(3) 测试算法的目的就是为了帮助我们选择一个更好的模型 训练数据集,测试数据集方面 一般来说,我们训练得到的模型直接在真实的环境中使用 这就导致了一些问题 如果模型很差,未经改进就应用在现实环境下,那这样得到的预测结果必然是不好的,而且在真实环境中,是难以拿到真实的label(输出结 阅读全文
posted @ 2021-01-13 21:44 DbWong_0918 阅读(129) 评论(0) 推荐(0) 编辑
摘要: ##KNN算法(2) 机器学习算法封装 scikit-learn中的机器学习算法封装 在python chame中将算法写好 import numpy as np from math import sqrt from collections import Counter def kNN_classi 阅读全文
posted @ 2021-01-13 21:33 DbWong_0918 阅读(167) 评论(0) 推荐(1) 编辑
摘要: ##KNN算法(1) 全称是K Nearest Neighbors k近邻算法: 思想简单 需要的数学知识很少 效果不错 可以解释机器学习算法使用过程中的很多细节问题 更加完整的刻画机器学习应用的流程 其思想总的来说就是在多个样本之间进行比较,越相似的话,新的样本就有更高的概率属于这个类别,一般用来 阅读全文
posted @ 2021-01-13 21:22 DbWong_0918 阅读(159) 评论(0) 推荐(1) 编辑
摘要: ##将onenote快速复制粘贴到博客园后台 开始的时候用OneNote记笔记,没想到复制粘贴下来的竟然是图片 导致写的东西想要放上来都得手打 网上好多都是让下一个插件之类的 其实原始一点,用记事本直接全部复制下来就行 首先 在OneNote点击上面的四个点就可以全选了 直接在记事本中粘贴,文字部分 阅读全文
posted @ 2021-01-13 15:46 DbWong_0918 阅读(252) 评论(0) 推荐(1) 编辑
摘要: ##关于解决numpy使用sklearn时的警告问题 在使用的时候,出现提示 :219: RuntimeWarning: numpy.ufunc size changed, may indicate binary incompatibility. Expected 192 from C header 阅读全文
posted @ 2021-01-13 15:23 DbWong_0918 阅读(931) 评论(0) 推荐(1) 编辑
摘要: ##读取数据以及简单的数据探索 读取数据与简单的数据探索 可以通过sklearn中的各种数据集来练手 以下是iris鸢尾花的全部数据信息及对应的情况 若想打印出全部情况(含有的属性) print(iris.DESCR) Iris.data全部数据 Iris.feature_names全部代表的名称 阅读全文
posted @ 2021-01-13 15:15 DbWong_0918 阅读(108) 评论(0) 推荐(1) 编辑
摘要: ##matplotilb基础 matplotilb是我们使用的一个基础的可视化方法 一般来说,使用matplotilb是较为专业的绘制图形的选择 不需要很专业的时候可以只是用matplotilb的子模块pyplot 首先我们先设置一个x,一个y 以x为横坐标,以y为纵坐标 通过plot(x,y)就可 阅读全文
posted @ 2021-01-13 15:11 DbWong_0918 阅读(238) 评论(0) 推荐(1) 编辑
摘要: ##numpy.array的基本运算以及对数据的操作 设置一个问题,例如 这种只需要基本的运算就可以实现 类似的 numpy对向量的运算进行了优化,速度是相当快的,这种被称为universal functions 可以使用+,-,,/,//, *(两个星号),%,1/(/表示浮点除,//表示整数除, 阅读全文
posted @ 2021-01-13 14:56 DbWong_0918 阅读(1093) 评论(0) 推荐(1) 编辑
摘要: ##numpy数组的合并与分割 ###合并操作 concatenate拼接,只能操作维数一样的数据 且并不局限于两个元素 对于二维数组来说,可以通过控制axis来控制是按照行还是按照列来进行拼接操作,默认为axis=0,垂直方向 想要统一维数,可以使用reshape,记得赋值保存 Vstack(垂直 阅读全文
posted @ 2021-01-13 14:30 DbWong_0918 阅读(84) 评论(0) 推荐(1) 编辑
摘要: ##numpy数组的基本操作 以几个数组为例 使用ndim可以显示出是几维数组 使用shape可以查看元素维度数 使用size可以查看元素个数 对一维数组进行数据访问 对多维数组进行数据访问 切片访问,使用:号,例如:0到5,不包含5的全部元素 :号前面没有数值,则从头开始 :号后面没有数值,则到尾 阅读全文
posted @ 2021-01-13 13:39 DbWong_0918 阅读(112) 评论(0) 推荐(1) 编辑
摘要: ##numpy.array基础 使用numpy.__version__可以检查numpy的版本 当然也可以直接使用命令行检查numpy版本 也可以用来简化引用,使用as python list特点 numpy是可以不限定类型的 array是限定类型的,降低了灵活性,但是效率更高,但是还有一个缺点,a 阅读全文
posted @ 2021-01-13 13:21 DbWong_0918 阅读(126) 评论(0) 推荐(1) 编辑
摘要: ##魔法命令 %run 可以调用自己编写的代码 代码内容 使用结果 测试时间有%timeit,%time %timeit 测试时间(生成表达式的逻辑) 测试次数是可以不定义的,有系统自己决定 算法复杂度可以用这种方法 %time 是物理感知时间,比较准确 %%timeit是用来度量单元格内整体的消耗 阅读全文
posted @ 2021-01-13 12:31 DbWong_0918 阅读(175) 评论(0) 推荐(1) 编辑
摘要: ##jupyter notebook基础使用 执行代码 添加格子 在输出结果的同时添加一行 run cells and insert below 输出结果,若后续没有新的代码行了,则会在后面添加一行 查看相应的快捷键 常用的快捷键(基本都在使用快捷键) 书写的文档设置 在未选中内容的时候(标头是蓝色 阅读全文
posted @ 2021-01-13 12:17 DbWong_0918 阅读(392) 评论(0) 推荐(1) 编辑