摘要: 熵条件熵经验熵 经验条件熵相对熵 互信息决策树 (Decision Tree)ID3 信息增益 (容易过拟合)计算信息增益选择信息增益最大的特征作为当前的分裂特征例子C4.5 信息增益比以信息增益 作为划分训练数据集的特征,存在偏向于 选择取值较多的特征的问题, 使用信息增益比 对这一问题 进行校正。CART树 Gini系数决策树的... 阅读全文
posted @ 2017-04-10 12:43 keven0526 阅读(271) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/4/9import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltfrom scipy.stats import norm, poissonimport timefrom... 阅读全文
posted @ 2017-04-09 14:05 keven0526 阅读(356) 评论(0) 推荐(0) 编辑
摘要: Numpy提供了ndarrayarange/linspace/logspace整数/布尔数组存取二维数组的切片元素去重stack and axis链接两个narange#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/3/28import numpy as npif __name__ == '__main_... 阅读全文
posted @ 2017-04-09 12:36 keven0526 阅读(160) 评论(0) 推荐(0) 编辑
摘要:  阅读全文
posted @ 2017-04-08 14:41 keven0526 阅读(106) 评论(0) 推荐(0) 编辑
摘要: python 默认字典 不具有 有序性使用有序字典 阅读全文
posted @ 2017-04-08 14:27 keven0526 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 普通方法每轮都有进球的球员(公共键)方法1 阅读全文
posted @ 2017-04-08 14:14 keven0526 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 方法1方法2 阅读全文
posted @ 2017-04-07 22:46 keven0526 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 普通方法from random import randintdata = [randint(0,20) for _ in xrange(30)]c = dict.fromkeys(data,0) #0 为初始值for x in data: c[x] + =1sorted(c.iteritems(), key=lambda x: x[1], reverse=True)# 对字典按值进行排序... 阅读全文
posted @ 2017-04-07 21:45 keven0526 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 方法 阅读全文
posted @ 2017-04-07 15:02 keven0526 阅读(109) 评论(0) 推荐(0) 编辑
摘要: 解决办法:列表 方法1列表解析 方法2字典解析集合解析 阅读全文
posted @ 2017-04-07 14:53 keven0526 阅读(187) 评论(0) 推荐(0) 编辑