摘要: 第十三章 利用PCA来简化数据 一.降维技术 当数据的特征很多的时候,我们把一个特征看做是一维的话,我们数据就有很高的维度。高维数据会带来计算困难等一系列的问题,因此我们需要进行降维。降维的好处有很多,比如:降低算法开销,让数据更加便于使用,去燥,数据更易于显示等等。 目前的降维技术主要有三种:第一 阅读全文
posted @ 2017-09-10 21:31 whatyouknow123 阅读(493) 评论(0) 推荐(0) 编辑
摘要: 第十章 利用k-均值聚类算法对未标注的数据进行分组 一.导语 聚类算法可以看做是一种无监督的分类方法,之所以这么说的原因是它和分类方法的结果相同,区别它的类别没有预先的定义。簇识别是聚类算法中经常使用的一个概念,使用这个概念是为了对聚类的结果进行定义。 聚类算法几乎可以用于所有的对象,并且簇内的对象 阅读全文
posted @ 2017-09-10 16:50 whatyouknow123 阅读(5596) 评论(0) 推荐(0) 编辑
摘要: 第十二章 使用FP-growth算法高效的发现频繁项集 一.导语 FP-growth算法是用于发现频繁项集的算法,它不能够用于发现关联规则。FP-growth算法的特殊之处在于它是通过构建一棵Fp树,然后从FP树上发现频繁项集。 FP-growth算法它比Apriori算法的速度更快,一般能够提高两 阅读全文
posted @ 2017-09-10 16:48 whatyouknow123 阅读(5487) 评论(0) 推荐(0) 编辑
摘要: 第十一章 使用Apriori算法进行关联分析 一.导语 “啤酒和尿布”问题属于经典的关联分析。在零售业,医药业等我们经常需要是要关联分析。我们之所以要使用关联分析,其目的是为了从大量的数据中找到一些有趣的关系。这些有趣的关系将对我们的工作和生活提供指导作用。 二.关联分析的基本概念 所谓的关联分析就 阅读全文
posted @ 2017-09-10 16:47 whatyouknow123 阅读(4199) 评论(0) 推荐(0) 编辑
摘要: Description: Given a collection of distinct numbers, return all possible permutations. For example,[1,2,3] have the following permutations: [ [1,2,3], 阅读全文
posted @ 2017-09-10 16:36 whatyouknow123 阅读(163) 评论(0) 推荐(0) 编辑