06 2017 档案

摘要:第六章51、关联规则的挖掘的两个过程1、找出所有的频繁项集2、由频繁项集产生强关联规则52、频繁项集挖掘方法 1、Apriori算法 2、挖掘频繁项集的模式增长方法 3、使用垂直数据格式挖掘频繁项集53、提高Apriori算法的效率 1、基于散列的技术 2、事务压缩 3、划分 4、抽样 5、动态项集 阅读全文
posted @ 2017-06-29 22:08 小春熙子 阅读(264) 评论(0) 推荐(0) 编辑
摘要:第十章63、什么是聚类分析 一个把数据对象划分成子集的过程。每一个子集市一个簇,使得簇中的对象彼此相似,但与其他簇中的对象不相似。由聚类分析产生的簇的集合称做一个聚类。64、数据挖掘对聚类的要求 1、可伸缩性 2、处理不同属性类型的能力 3、发现任意形状的簇 4、对于确定输入参数的领域知识的要求 5 阅读全文
posted @ 2017-06-29 22:08 小春熙子 阅读(206) 评论(0) 推荐(0) 编辑
摘要:第四章39、为什么在进行联机分析处理(OLAP)时,我们需要一个独立的数据仓库,而不是直接在日常操作的数据库上进行 1、提高两个系统的性能 2、操作数据库支持多事务的并发处理,需要并发控制和恢复机制,确保一致性和事务的鲁棒性 3、两者有着不同的数据的结构、内容和用法40、什么是数据仓库 数据仓库是一 阅读全文
posted @ 2017-06-29 22:07 小春熙子 阅读(249) 评论(0) 推荐(0) 编辑
摘要:第二章21、研究的属性类型标称属性:值是一些符号或事物的名称,代表某种类型、编码或状态二元属性:是一种标称属性,只有两个类别或状态,又称布尔属性序数属性:是一种属性,其可能的值之间具有有意义的序或秩评定,但是相续值之间的差是未知的数值属性:是定量的,即他是可度量的量,可用整数或实数值表示(区间和比率 阅读全文
posted @ 2017-06-29 22:06 小春熙子 阅读(315) 评论(0) 推荐(0) 编辑
摘要:第一章1、数据仓库技术:1、数据清理 2、数据集成 3、联机分析处理2、数据挖掘(知识发现)过程P5详见图 1、数据清理 2、数据集成 3、数据选择 4、数据变换 5、数据挖掘 6、模式评估 7、知识表示3、大数据的特点: 1、量大 2、种类多 3、处理速度快 4价值密度低 5、复杂性4、类与概念描 阅读全文
posted @ 2017-06-29 22:04 小春熙子 阅读(563) 评论(0) 推荐(0) 编辑
摘要:一.创建时间序列工作文件:首先将数据转换为Eviews系统能够分析的Eviews Workfile数据集 1.创建工作文件:工作文件结构类型:非结构/非日期型;日期-规则频率型;平衡面板型; 需要注意的是,在输入季度,月度,周度数据时,都需要在年度后相应加上Q,M,W和相应的数字 比如:1999年第 阅读全文
posted @ 2017-06-09 12:38 小春熙子 阅读(1484) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示