随笔分类 - 数据分析与数据挖掘
金融时间序列数据分析等等
摘要:第六章51、关联规则的挖掘的两个过程1、找出所有的频繁项集2、由频繁项集产生强关联规则52、频繁项集挖掘方法 1、Apriori算法 2、挖掘频繁项集的模式增长方法 3、使用垂直数据格式挖掘频繁项集53、提高Apriori算法的效率 1、基于散列的技术 2、事务压缩 3、划分 4、抽样 5、动态项集
阅读全文
摘要:第十章63、什么是聚类分析 一个把数据对象划分成子集的过程。每一个子集市一个簇,使得簇中的对象彼此相似,但与其他簇中的对象不相似。由聚类分析产生的簇的集合称做一个聚类。64、数据挖掘对聚类的要求 1、可伸缩性 2、处理不同属性类型的能力 3、发现任意形状的簇 4、对于确定输入参数的领域知识的要求 5
阅读全文
摘要:第四章39、为什么在进行联机分析处理(OLAP)时,我们需要一个独立的数据仓库,而不是直接在日常操作的数据库上进行 1、提高两个系统的性能 2、操作数据库支持多事务的并发处理,需要并发控制和恢复机制,确保一致性和事务的鲁棒性 3、两者有着不同的数据的结构、内容和用法40、什么是数据仓库 数据仓库是一
阅读全文
摘要:第二章21、研究的属性类型标称属性:值是一些符号或事物的名称,代表某种类型、编码或状态二元属性:是一种标称属性,只有两个类别或状态,又称布尔属性序数属性:是一种属性,其可能的值之间具有有意义的序或秩评定,但是相续值之间的差是未知的数值属性:是定量的,即他是可度量的量,可用整数或实数值表示(区间和比率
阅读全文
摘要:第一章1、数据仓库技术:1、数据清理 2、数据集成 3、联机分析处理2、数据挖掘(知识发现)过程P5详见图 1、数据清理 2、数据集成 3、数据选择 4、数据变换 5、数据挖掘 6、模式评估 7、知识表示3、大数据的特点: 1、量大 2、种类多 3、处理速度快 4价值密度低 5、复杂性4、类与概念描
阅读全文
摘要:一.创建时间序列工作文件:首先将数据转换为Eviews系统能够分析的Eviews Workfile数据集 1.创建工作文件:工作文件结构类型:非结构/非日期型;日期-规则频率型;平衡面板型; 需要注意的是,在输入季度,月度,周度数据时,都需要在年度后相应加上Q,M,W和相应的数字 比如:1999年第
阅读全文