Laurel

导航

2019年2月25日 #

Python四步实现决策树ID3算法,参考机器学习实战

摘要: 一、编写计算历史数据的经验熵函数 二、按照指定特征和其特征值来划分数据集 参数axis指定是第几个特征,value是该特征什么值,这个函数会在第三步的函数和第四步里被调用,主要作用在相应步结束后介绍 三、计算每个特征的熵,求得信息增益,返回使得信息增益最大的特征 比较难理解的就是第二个for迭代中的 阅读全文

posted @ 2019-02-25 17:47 Laurel1115 阅读(459) 评论(0) 推荐(0) 编辑

2019年2月23日 #

时间序列算法(平稳时间序列模型,AR(p),MA(q),ARMA(p,q)模型和非平稳时间序列模型,ARIMA(p,d,q)模型)的模型以及需要的概念基础学习笔记梳理

摘要: 在做很多与时间序列有关的预测时,比如股票预测,餐厅菜品销量预测时常常会用到时间序列算法,之前在学习这方面的知识时发现这方面的知识讲解不多,所以自己对时间序列算法中的常用概念和模型进行梳理总结(但是为了内容的正确性有些内容我通过截图来记录吧),希望能有所帮助^.^ 一、时间序列的预处理 在拿到基于时间 阅读全文

posted @ 2019-02-23 16:24 Laurel1115 阅读(5457) 评论(0) 推荐(0) 编辑

2019年2月22日 #

Python两步实现关联规则Apriori算法,参考机器学习实战,包括频繁项集的构建以及关联规则的挖掘

摘要: 这是我学习了关联规则Apriori算法原理后参照《机器学习实战》实现的算法代码,首先分为两个部分,第一部分是频繁项集的构建,第二部分是关联规则的挖掘。特别的是我的测试数据也就是loadDataSet()函数中的数据进行了改变,这是为了能帮助理解第二部分。然后代码中我加了很多为了让自己理解的输出测试, 阅读全文

posted @ 2019-02-22 10:47 Laurel1115 阅读(852) 评论(0) 推荐(0) 编辑

2019年2月16日 #

基于逻辑回归的利用欠采样处理类别不平衡的信用卡欺诈检测

摘要: In [2]: import pandas as pd import matplotlib.pyplot as plt import numpy as np %matplotlib inline 一、获取数据集 (一)认识数据、分析数据,确定研究方法 1.数据集简介: 这个信用卡欺诈数据集是从kag 阅读全文

posted @ 2019-02-16 18:11 Laurel1115 阅读(1941) 评论(2) 推荐(0) 编辑

2019年1月22日 #

利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目(在这个过程中学习关于模型性能的评价指标,如accuracy,precision,recall,混淆矩阵)

摘要: 一、获取MNIST手写数据集 需要注意的是直接运行下面的代码可能不能直接下载成功,可以从这里先提前(https://download.csdn.net/download/x454045816/10157075) 下载,放到mldata文件夹中,就不会报错了 In [6]: from sklearn. 阅读全文

posted @ 2019-01-22 18:24 Laurel1115 阅读(1776) 评论(0) 推荐(0) 编辑

2019年1月19日 #

利用Sklearn实现加州房产价格预测,学习运用机器学习的整个流程(包含很多细节注解)

摘要: Chapter1_housing_price_predict 一、导入需要用到的库 In [6]: import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt impo 阅读全文

posted @ 2019-01-19 17:05 Laurel1115 阅读(1556) 评论(0) 推荐(0) 编辑