05 2013 档案
摘要:一、装袋 对样本空间 D 进行 放回抽样,得到样本空间的一个子集 Di,由Di得到一个 分类器Mi。 不断的重复上述过程,就可以得到一系列分类器 M1,M2,M3....Mi ,在分类时用这些分类器进行投票来决定分类。 在R语言中装袋的函数存在于ipred (Improved Predictors)
阅读全文
摘要:一、装袋对样本空间 D 进行 放回抽样,得到样本空间的一个子集 Di,由Di得到一个 分类器Mi。不断的重复上述过程,就可以得到一系列分类器 M1,M2,M3....Mi ,在分类时用这些分类器进行投票来决定分类。二、提升和AdaBoost对长度为d的训练样本空间 D 的每一个元组分配一个初始的权限...
阅读全文
摘要:在所分析的10000个事务中,6000个事务包含计算机游戏,7500个包含游戏机游戏,4000个事务同时包含两者。关联规则(计算机游戏,游戏机游戏) 支持度为0.4,看似很高,但其实这个关联规则是一个误导。在用户购买了计算机游戏后有 (4000÷6000)0.667 的概率的去购买游戏机游戏,而在没...
阅读全文
摘要:详解python实现FP-TREE进行关联规则挖掘(带有FP树显示功能)附源代码下载(5)在这一个节我们将谈一谈算法的优化。一 构造树的优化方法:1. 垂直数据格式中,diffset法,这些方法在.《数据挖掘 概念与技术》这本书都有提到但都有缺陷,不善于发现长模式(长模式是什么意思?谁来告诉我?)。...
阅读全文
摘要:详解python实现FP-TREE进行关联规则挖掘(带有FP树显示功能)附源代码下载(4)上一节我们讲到根据一颗树的情况来判断是否有必要进行进一步的挖掘,这里有一个重要的概念叫单路径树,请看下面三张图: 图1 图2图3它们分别是beer ,chips和 milk 的条件模式 子树,当对最小支持度为...
阅读全文
摘要:详解python实现FP-TREE进行关联规则挖掘(带有FP树显示功能)附源代码下载(3)上一节简单讲了下FP树的生成,在这一节我将描述FP树的挖掘过程.首先我们回顾一下要挖掘的特征项及样本空间:items=('chips','eggs','bread','milk','beer','popcorn...
阅读全文
摘要:详解python实现FP-TREE进行关联规则挖掘(带有FP树显示功能)附源代码下载(2)fptree进行数据挖掘的第一步是生成fptree,具体的生成过程大家在网上和书上都能找到详尽的解释,这里我就不再赘述了。不过大家可能会产生一个问题:为什么要对每一条样本记录按照其中特征项支持度从大到小排序一下...
阅读全文
摘要:1.多个str合并时不要用+号,应该用list的join函数, 详见:http://tieba.baidu.com/p/2599027753在这个实验中,表明超过170个str合并时 join函数更占优2,list 的内部实现类似C++ STL中的vector, 当发生重新分配内存或者在list 首...
阅读全文
摘要:import copydef freshdefaults(f): d=f.__defaults__ def refresher(*args,**kwds): f.__defaults__=copy.deepcopy(d) return f(*args,**kw...
阅读全文
摘要:详解python实现FP-TREE进行关联规则挖掘(带有FP树显示功能)附源代码下载(1)程序使用PYTHON3.2实现,要生成每一步树的图片,请安装一个绘图库PIL(Python Image Library)源代码下载地址:点击打开链接打开源代码后可以在sample.py找到样本如下:items=...
阅读全文
摘要:1. 通配符映射 * 映射到 aspnet_iisapi.dll2. 应用程序池 托管管道模式 经典
阅读全文
摘要:在windows上使用open打开utf-8编码的txt文件时开头会有一个多余的字符它叫BOM,是用来声明编码等信息的,但python会把它当作文本解析解决办法:open的encoding参数for line in open('1.txt', encoding='utf_8_sig' ):
阅读全文
摘要:监督学习算法是指需要样本空间进行训练后才能作出预测或分类的算法,典型的例子有贝叶斯分类器、决策树和神经网络非监督学习算法的代表有聚类算法和特征矩阵可以从以下几个方面来比较算法:1.支持增量式训练:在收录新的数据后能自行调整,修正判断,提高准确率而不需要重新训练2.特征组合:能够响应特征组合,作出更精...
阅读全文