上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页
摘要: 学习了机器学习这么久,第一次真正用机器学习中的方法解决一个实际问题,一步步探索,虽然最后结果不是很准确,仅仅达到了0.78647,但是真是收获很多,为了防止以后我的记忆虫上脑,我决定还是记录下来好了。 1,看到样本是,查看样本的分布和统计情况 通常遇到缺值的情况,我们会有几种常见的处理方式 如果缺值 阅读全文
posted @ 2019-10-31 17:27 笔记记忆 阅读(301) 评论(0) 推荐(0) 编辑
摘要: python3使用matplotlib画图,因python3默认使用中unicode编码,所以在写代码时不再需要写 plt.xlabel(u’人数’),而是直接写plt.xlabel(‘人数’)。 注意: 在有中文的地方加上中文相关的字体,不然会因为没有字体显示成放框,因为默认的使用的字体里没有中文 阅读全文
posted @ 2019-10-31 17:26 笔记记忆 阅读(292) 评论(0) 推荐(0) 编辑
摘要: 1.Pandas 基本介绍 Numpy 和 Pandas 有什么不同? 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。 pandas基本功能和 阅读全文
posted @ 2019-10-31 17:25 笔记记忆 阅读(324) 评论(0) 推荐(0) 编辑
摘要: 转自https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/2-1-np-attributes/ numpy 的属性: 使用numpy首先要导入模块 import numpy as np #为了方便使用numpy 采用np简写 列 阅读全文
posted @ 2019-10-31 17:23 笔记记忆 阅读(532) 评论(0) 推荐(0) 编辑
摘要: 首先是sklearn的官网:http://scikit-learn.org/stable/ 在官网网址上可以看到很多的demo,下边这张是一张非常有用的流程图,在这个流程图中,可以根据数据集的特征,选择合适的方法。 2.sklearn使用的小例子 3.sklearn数据集 在上边例子中,直接使用了s 阅读全文
posted @ 2019-10-31 17:21 笔记记忆 阅读(1109) 评论(0) 推荐(0) 编辑
摘要: 在学习python的时候常常需要numpy这个库,每次都是用一个查一个,这个,终于见到一个完整的总结了http://blog.csdn.net/blog_empire/article/details/39298557 一、数组方法 创建数组:arange()创建一维数组;array()创建一维或多维 阅读全文
posted @ 2019-10-31 17:19 笔记记忆 阅读(1902) 评论(0) 推荐(0) 编辑
摘要: 安装SK-Learn需要依赖的Python安装包有: Python (>= 2.6), NumPy (>= 1.3), SciPy (>= 0.7), 下载python的各种包的地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 在下载各种包的时候要注意版本的 阅读全文
posted @ 2019-10-31 17:18 笔记记忆 阅读(283) 评论(0) 推荐(0) 编辑
摘要: 浅述python中argsort()函数的用法 (1).先定义一个array数据 (2).现在我们可以看看argsort()函数的具体功能是什么: 输出定义为y=array([3,0,2,1,4,5])。 我们发现argsort()函数是将x中的元素从小到大排列,提取其对应的index(索引),然后 阅读全文
posted @ 2019-10-31 17:17 笔记记忆 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 决策树的优势就在于数据形式非常容易理解,而kNN的最大缺点就是无法给出数据的内在含义。 1:简单概念描述 决策树的类型有很多,有CART、ID3和C4.5等,其中CART是基于基尼不纯度(Gini)的,这里不做详解,而ID3和C4.5都是基于信息熵的,它们两个得到的结果都是一样的,本次定义主要针对I 阅读全文
posted @ 2019-10-31 17:15 笔记记忆 阅读(363) 评论(0) 推荐(0) 编辑
摘要: KNN算法很简单,大致的工作原理是:给定训练数据样本和标签,对于某测试的一个样本数据,选择距离其最近的k个训练样本,这k个训练样本中所属类别最多的类即为该测试样本的预测标签。简称kNN。通常k是不大于20的整数,这里的距离一般是欧式距离。 对于上边的问题,①计算测试样本与训练样本的距离,②选择与其最 阅读全文
posted @ 2019-10-31 17:14 笔记记忆 阅读(315) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 15 下一页