摘要: 1.数据仓库的定义 数据仓库是一个面向主题的,集成的,时变的和非易失的数据集合,支持管理部门的决策过程。 面向主题的:数据仓库都围绕一些主题来组织:如顾客,供应商,产品和销售等某一特定的目的,而非组织机构的日常操作和事务管理。即:数据仓库排除对于决策无用的数据,它提供的是特定主题的简明视图。 集成的 阅读全文
posted @ 2016-11-24 16:38 YJ-20 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 1.静态数组的初始化 数据类型[] 数组名称=new 数据类型[]{1,2,1,3}; 内存模型: 2.动态数组的初始化 数据类型[] 数组名称=new 数据类型[a]; 其中a=数据的长度为整数。 内存模型: 阅读全文
posted @ 2016-11-19 14:16 YJ-20 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 1.内存分区。 内存区域分为五块:方法区,虚拟机栈,堆,本地方法栈,程序计数器。 方法区:线程共享的内存区域。存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译的代码数据等。而并非存储的方法代码。 虚拟机栈:JAVA中描述JAVA方法执行的内存模型。每个方法创建的时候都会创建一个栈帧,栈帧用 阅读全文
posted @ 2016-11-19 12:50 YJ-20 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 1。论方法重载的作用。 同一方法不同用处。保持方法名不变,方便程序的理解。即:叫这个名字的方法就是干这个事情的。例:我的add方法就是做加法的。只不过我的add(int,int)做int型数据的加法,add(float,float)做float型数据的加法,如果每个不同的方法都起一个名字,则上面的例 阅读全文
posted @ 2016-11-19 12:05 YJ-20 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 1.数据离散化和概念分层的原理和目的 通过将属性值域划分为区间,用区间标记代替实际的数值,用来减少给定连续属性值的个数。 2.离散化技术分类 例如:自顶向下:首先找出一个或几个点作为分裂点来对真个属性空间进行划分,然后再在结果区间上递归重复该过程。 自底向上:首相将所有的连续之看做分裂点,然后合并相 阅读全文
posted @ 2016-11-09 11:13 YJ-20 阅读(2227) 评论(1) 推荐(0) 编辑
摘要: 1.数据规约的意义: 对海量的而数据进行分析和挖掘,需要大量的时间,使得这种分析可能不现实或不可行。数据规约对数据集的规约表示进行分析,这样需要分析的数据少得多,但并不影响数据挖掘的效果。 2.数据规约的策略 a.数据立方体聚集:类似于前面的数据聚集,对数据立方体进行上卷和下钻,在不同抽象层次进行分 阅读全文
posted @ 2016-11-03 14:08 YJ-20 阅读(1632) 评论(0) 推荐(0) 编辑
摘要: 1.数据规范化的方法和意义 通过将属性值按照比例缩放,使之进入 一个较小的特定区间,即对属性进行规范化。方法:最小--最大规范化;z-score规范化;小数定标规范化。 a.最小--最大规范化 阅读全文
posted @ 2016-11-03 09:29 YJ-20 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 1.数据集成需考虑的问题 a.模式集成和对象匹配 b.冗余。原因一:能够用一个或一组属性导出,原因二:属性或维命名的不一致。 2.属性冗余的相关分析检测 a.数值属性计算相关系数 说明:n为元祖个数,ai,bi分别为元祖i中属性A,B的值。-A,-B分别为A和B的均值,然后是A,B的标准差,然后是A 阅读全文
posted @ 2016-11-01 11:39 YJ-20 阅读(618) 评论(0) 推荐(0) 编辑
摘要: 1.数据清理清理什么。 缺失值,噪声,纠正数据的不一致 2.清理噪声的方法 a.分箱。对象是有序的数据。可以用箱的均值,中位数,箱边界光滑(箱中的每一个值都被据它最近的边界值代替)。 b.回归。用一个函数拟合数据进行光滑。 c.聚类。 3.数据清理作为一个过程 a.偏差检测(第一步检测。主要解决不一 阅读全文
posted @ 2016-11-01 09:38 YJ-20 阅读(385) 评论(0) 推荐(0) 编辑
摘要: 1.数据清理: 通过填写缺失的值,光滑噪声数据,识别或删除离群点并解决不一致性来清理数据。 2.数据集成 集成多个数据库,数据立方体或文件。 由于不同的数据库同一概念的属性可能有不同的名字,或者属性值命名不一致等都会造成不一致性和冗余。所以在准备数据时应当避免数据冗余,还不仅仅是简单的组合在一起。 阅读全文
posted @ 2016-10-31 10:24 YJ-20 阅读(532) 评论(0) 推荐(0) 编辑