笔记记忆 - 博客园

2019年10月31日

摘要：学习了机器学习这么久，第一次真正用机器学习中的方法解决一个实际问题，一步步探索，虽然最后结果不是很准确，仅仅达到了0.78647，但是真是收获很多，为了防止以后我的记忆虫上脑，我决定还是记录下来好了。 1，看到样本是，查看样本的分布和统计情况通常遇到缺值的情况，我们会有几种常见的处理方式如果缺值阅读全文

posted @ 2019-10-31 17:27 笔记记忆阅读(323) 评论(0) 推荐(0)

matplotlib画图出现乱码情况

摘要： python3使用matplotlib画图，因python3默认使用中unicode编码，所以在写代码时不再需要写 plt.xlabel(u’人数’)，而是直接写plt.xlabel(‘人数’)。注意：在有中文的地方加上中文相关的字体，不然会因为没有字体显示成放框，因为默认的使用的字体里没有中文阅读全文

posted @ 2019-10-31 17:26 笔记记忆阅读(306) 评论(0) 推荐(0)

Pandas

摘要： 1.Pandas 基本介绍 Numpy 和 Pandas 有什么不同? 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的，没有数值标签，而 Pandas 就是字典形式。Pandas是基于Numpy构建的，让Numpy为中心的应用变得更加简单。 pandas基本功能和阅读全文

posted @ 2019-10-31 17:25 笔记记忆阅读(329) 评论(0) 推荐(0)

numpy常用举例

摘要：转自https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/2-1-np-attributes/ numpy 的属性: 使用numpy首先要导入模块 import numpy as np #为了方便使用numpy 采用np简写列阅读全文

posted @ 2019-10-31 17:23 笔记记忆阅读(566) 评论(0) 推荐(0)

scikit-learn 应用

摘要：首先是sklearn的官网：http://scikit-learn.org/stable/ 在官网网址上可以看到很多的demo，下边这张是一张非常有用的流程图，在这个流程图中，可以根据数据集的特征，选择合适的方法。 2.sklearn使用的小例子 3.sklearn数据集在上边例子中，直接使用了s 阅读全文

posted @ 2019-10-31 17:21 笔记记忆阅读(1194) 评论(0) 推荐(0)

numpy基本函数

摘要：在学习python的时候常常需要numpy这个库，每次都是用一个查一个，这个，终于见到一个完整的总结了http://blog.csdn.net/blog_empire/article/details/39298557 一、数组方法创建数组：arange()创建一维数组；array()创建一维或多维阅读全文

posted @ 2019-10-31 17:19 笔记记忆阅读(1976) 评论(0) 推荐(0)

pytong下安装安装SK-Learn

摘要：安装SK-Learn需要依赖的Python安装包有： Python (>= 2.6), NumPy (>= 1.3), SciPy (>= 0.7), 下载python的各种包的地址：http://www.lfd.uci.edu/~gohlke/pythonlibs/ 在下载各种包的时候要注意版本的阅读全文

posted @ 2019-10-31 17:18 笔记记忆阅读(318) 评论(0) 推荐(0)

python 在机器学习中应用函数

摘要：浅述python中argsort()函数的用法（1）.先定义一个array数据（2）.现在我们可以看看argsort()函数的具体功能是什么：输出定义为y=array([3,0,2,1,4,5])。我们发现argsort()函数是将x中的元素从小到大排列，提取其对应的index(索引)，然后阅读全文

posted @ 2019-10-31 17:17 笔记记忆阅读(440) 评论(0) 推荐(0)

决策树实战

摘要：决策树的优势就在于数据形式非常容易理解，而kNN的最大缺点就是无法给出数据的内在含义。 1：简单概念描述决策树的类型有很多，有CART、ID3和C4.5等，其中CART是基于基尼不纯度(Gini)的，这里不做详解，而ID3和C4.5都是基于信息熵的，它们两个得到的结果都是一样的，本次定义主要针对I 阅读全文

posted @ 2019-10-31 17:15 笔记记忆阅读(383) 评论(0) 推荐(0)

KNN 实战

摘要： KNN算法很简单，大致的工作原理是：给定训练数据样本和标签，对于某测试的一个样本数据，选择距离其最近的k个训练样本，这k个训练样本中所属类别最多的类即为该测试样本的预测标签。简称kNN。通常k是不大于20的整数，这里的距离一般是欧式距离。对于上边的问题，①计算测试样本与训练样本的距离，②选择与其最阅读全文

posted @ 2019-10-31 17:14 笔记记忆阅读(335) 评论(0) 推荐(0)

公告