2017年4月21日

Python实现决策树C4.5算法

摘要: 为什么要改进成C4.5算法 原理 C4.5算法是在ID3算法上的一种改进,它与ID3算法最大的区别就是特征选择上有所不同,一个是基于信息增益比,一个是基于信息增益。 之所以这样做是因为信息增益倾向于选择取值比较多的特征(特征越多,条件熵(特征划分后的类别变量的熵)越小,信息增益就越大);因此在信息增 阅读全文

posted @ 2017-04-21 20:01 WOTGL 阅读(10425) 评论(2) 推荐(0) 编辑

2017年4月20日

Python实现决策树ID3算法

摘要: 主要思想: 0、训练集格式:特征1,特征2,...特征n,类别 1、采用Python自带的数据结构字典递归的表示数据 2、ID3计算的信息增益是指类别的信息增益,因此每次都是计算类别的熵 3、ID3每次选择最优特征进行数据划分后都会消耗特征 4、当特征消耗到一定程度,可能会出现数据实例一样,但是类别 阅读全文

posted @ 2017-04-20 20:24 WOTGL 阅读(895) 评论(0) 推荐(0) 编辑

2017年4月19日

ML——决策树模型

摘要: 决策树模型 优点:高效简单、易于理解,可以处理不相关特征。 缺点:容易过拟合,训练集在特征上是完备的 决策树过程:特征选择、划分数据集、构建决策树、决策树剪枝 决策树选择最优的划分特征,将数据集按照最优划分特征的取值划分成不同的子集,然后依次对子集重复上述步骤,指导子集中数据都归属于同一个类别,或者 阅读全文

posted @ 2017-04-19 23:07 WOTGL 阅读(460) 评论(0) 推荐(0) 编辑

2017年4月18日

Linux下用matplotlib画决策树

摘要: 1、trees = {'no surfacing': { 0: 'no', 1: {'flippers': {0: 'no', 1: 'yes'}}}} 2、从我的文件trees.txt里读的决策树,也是一个递归字典表示 ps:参考博客[http://blog.csdn.net/ifruoxi/ar 阅读全文

posted @ 2017-04-18 22:00 WOTGL 阅读(441) 评论(0) 推荐(0) 编辑

RedHat7.2安装matplotlib——之Python.h:没有那个文件或目录

摘要: 按理说运行下面一句就可以安装了 但是对于我的redhat7.2+python2.7.5,报了下面的错误 _posixsubprocess.c:3:20: 致命错误:Python.h:没有那个文件或目录 于是需要先安装python-devel 阅读全文

posted @ 2017-04-18 21:52 WOTGL 阅读(1608) 评论(0) 推荐(0) 编辑

2017年4月16日

没想到这么简单——滚雪球

摘要: 今天做了一件非常开心的事,事情是这样的。 上午去玉泉路听完老师学长们的科研分享会,回到所里发现衣服胳膊肘地方开了两个大缝,特别生气。这个衣服是新买的,穿了不到两次,没想到质量这么差;一想到又要去跟老板交涉,心就好累。 吃晚饭时候跟碧爷去店里找老板,来的路上,我还跟碧爷商量怎么跟老板交涉,我们以为换估 阅读全文

posted @ 2017-04-16 20:01 WOTGL 阅读(133) 评论(0) 推荐(0) 编辑

2017年4月14日

pyspark中使用累加器Accumulator统计指标

摘要: 评价分类模型的性能时需要用到以下四个指标 最开始使用以下代码计算,发现代码需要跑近一个小时,而且这一个小时都花在这四行代码上 心想着理论上可以只扫描一遍数据就可以计算出这四个指标。 一开始在foreach函数中传递一个自定义评估函数,这个函数来统计上面四个指标,然后在函数里再使用全局变量TP,TN等 阅读全文

posted @ 2017-04-14 21:42 WOTGL 阅读(2170) 评论(0) 推荐(0) 编辑

2017年4月13日

pscp多线程传输文件

摘要: 前面说过pscp不支持多线程,所以在此特地实现了一个 程序分三个部分: 1、初始化各种参数,涉及getopt函数的使用 2、重新定义scp,实现传递IP然后远程拷贝 3、启动多线程调用scp,涉及多线程的启动和等待线程结束 测试结果: ps:对于读取带选项参数和Python多线程参考了以下两篇博客 阅读全文

posted @ 2017-04-13 20:23 WOTGL 阅读(3247) 评论(0) 推荐(0) 编辑

2017年4月1日

Linux离线安装pip和numpy

摘要: 首先说明一下pip在线安装程序会发生什么 例如: 运行pip install numpy 1、pip会先下载与自己机器匹配的wheel安装包 我的是numpy-1.12.1-cp27-cp27mu-manylinux1_x86_64.whl 2、pip会运行如下命令来安装wheel安装包 pip i 阅读全文

posted @ 2017-04-01 11:44 WOTGL 阅读(4083) 评论(1) 推荐(1) 编辑

2017年3月28日

Linux在线安装pip和numpy

摘要: 最近写Python需要用到numpy包 运行pip install numpy就会自动安装 一、因此需要先安装pip 1、如果安装的是Python>=2.7.9或者Python>=3.4,那么Python已经集成了pip,只是需要在线更新一下pip pip is already installed 阅读全文

posted @ 2017-03-28 16:17 WOTGL 阅读(11152) 评论(0) 推荐(0) 编辑

导航