2021年11月18日

决策树-属性选择

摘要: 现在,我们要做的是进行属性(或者说特征)的选择 光看程序清单3-2,以及把数组带进去运行一遍可能也有点不清晰,最好先看一下西瓜书 然后意思是传进去一个数据集,对于某一列(axis=0表示第1列),如果为0(value=0),那么保留这一行但是不要这个属性对应的值 import shannonEnt 阅读全文

posted @ 2021-11-18 10:59 lpzju 阅读(146) 评论(0) 推荐(0) 编辑

2021年11月17日

决策树-信息增益

摘要: 首先计算Ent,这里最好看一下西瓜书的P75页,结合着来学习 我们首先要计算信息熵Ent,然后再计算信息增益Gain from math import log # 数据集 dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'n 阅读全文

posted @ 2021-11-17 19:34 lpzju 阅读(102) 评论(0) 推荐(0) 编辑

kNN-识别手写数字

摘要: 最后,我们要进行手写数字分类任务,但是现在我们是用kNN算法,可能会比较慢 首先,完整地看完2.3.1和2.3.2的内容,然后找到trainingDigits和testDigits文件夹,大致浏览下 那么思路应该是: 从文件夹中获取文件名,,并且文件名中包含了标记,再分别打开每个文件 对打开的每个文 阅读全文

posted @ 2021-11-17 11:42 lpzju 阅读(75) 评论(0) 推荐(0) 编辑

2021年11月16日

kNN-预测

摘要: 现在进行第五步,对数据进行预测 那么要做的的是从数据集里面拿出一部分作为要预测的,剩下的去比较,书上使用的是10% # 对之前做好的kNN算法进行预测 # 首先获取之前构造好的kNN分类器、数据、规则化之后的数据 import kNN import norm # 倒完包之后先别急,目的是从规则化的数 阅读全文

posted @ 2021-11-16 23:27 lpzju 阅读(272) 评论(0) 推荐(0) 编辑

kNN-画图

摘要: 现在我们想要展示一些可视化内容 首先导包,如果是在jupyter notebook上,需要加入魔法函数:%matplotlib inline,这表示可以在jupyter上直接画图 import datingTest import matplotlib.pyplot as plt import num 阅读全文

posted @ 2021-11-16 23:26 lpzju 阅读(70) 评论(0) 推荐(0) 编辑

numpy学习笔记Ⅰ

摘要: 一直被numpy和matplotlib困扰,打算好好学习一下,也是从自己的观点,学对自己帮助最大的部分 主要参考<https: www.runoob.com="" numpy="" numpy-advanced-indexing.html=""> Numpy numpy主要用于多维数组和矩阵,与ma 阅读全文

posted @ 2021-11-16 10:14 lpzju 阅读(48) 评论(0) 推荐(0) 编辑

2021年11月15日

kNN-准备数据

摘要: 在上一小节,我们大概了解了kNN算法的基本原理,现在我们要进行数据的处理 本小节所用数据集来自[机器学习实战]:Machine Learning in Action (manning.com) 下载数据集后,将datingTestSet2.txt和datingTestSet放在本程序同一文件夹下 首 阅读全文

posted @ 2021-11-15 10:45 lpzju 阅读(124) 评论(0) 推荐(0) 编辑

2021年11月12日

机器学习实战-k近邻算法

摘要: 写在开头,打算耐心啃完机器学习实战这本书,所用版本为2013年6月第1版 在P19页的实施kNN算法时,有很多地方不懂,遂仔细研究,记录如下: 字典按值进行排序 首先仔细读完kNN算法之后,了解其是用距离来进行判别 程序清单2-1看不太明白,于是把具体的inX,dataSet,labels,k带进去 阅读全文

posted @ 2021-11-12 16:32 lpzju 阅读(29) 评论(0) 推荐(0) 编辑

导航