摘要: 1 切片和切块(Slice and Dice)在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“贷款银行、贷款质量、时间”三维立方体中进行切块和切片,可得到各贷款银行、各种贷款的统计情况。每次都是沿其中一维进行分割称为分片,每次沿多维进行的分片称为分块。2、钻取(Drill)钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作, 钻取的深度与维所划分的层次相对应。3 旋转(Rotate)/转轴(Pivot)通过旋转可以得到不同视角的数据 阅读全文
posted @ 2011-07-15 11:26 honkcal 阅读(8591) 评论(0) 推荐(0) 编辑
摘要: 1 OLAP 分析OLAP 分析,又称多维分析,使分析人员能够从多个角度对从原始数据中转化出来的、能够真正为用户所理解的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP 也可以简单定义成使用户能够以多维视图分析数据的工具。管理人员往往希望从不同的角度来审视业务情况,比如从时间、地域、产品、客户等来看收入、利润、支出等业务统计数字。每一个分析的角度可以叫做一个维,因此,我们把多角度分析方式称为多维分析。以前,每一个分析的角度需要制作一张报表。在线多维分析工具的主要功能,是根据用户常用的多种分析角度,事先计算好一些辅助结构,以便在查询时能尽快访问到所要的汇总数字, 阅读全文
posted @ 2011-07-15 11:19 honkcal 阅读(5644) 评论(1) 推荐(0) 编辑
摘要: 1、粒度粒度是数据仓库的重要概念。粒度可以分为两种形式,第一种粒度是对数据仓库中的数据的汇总程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能回答询问信息的种类。在数据仓库中,多维粒度是必不可少的。由于数据仓库的主要作用是多维分析,因而绝大多数查询都基于一定程度的汇总数据之上的,只有极少数查询涉及到细节。还有一种粒度形式,即样本数据库。它根据给定的采样率从细节数据库中抽取出一个子集。这样样本数据库中的粒度就不是根据汇总程度的不同来划分的,而是有采样率的高低来划分,采样粒度不同的样本数据库可以具有相同的数据汇总程度。2、分割分割是数据仓库中的数据存储中的另外一个重要概念,它 阅读全文
posted @ 2011-07-15 10:59 honkcal 阅读(701) 评论(0) 推荐(0) 编辑
摘要: 逻辑建模是数据仓库实施中的重要一环, 因为它能直接反映出决策者管理者的需求, 同时对系统的物理实施有着重要的指导作用。目前较常用的包含有星型模式。星型模式是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimens ion Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称为事实 (Fact),它们一般都是数值或其他可以进行计算的数据; 而维大都是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不同的维(事实表的主键的部分或全部)来对这些事实数据进行求和(summary)、求平均(average)、计数(co 阅读全文
posted @ 2011-07-15 10:54 honkcal 阅读(2172) 评论(0) 推荐(1) 编辑
摘要: 按照W.H.Inmon 这位数据仓库权威的说法,“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。这个简短而又全面的定义指出了表明数据仓库主要特征的四个关键词:面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统(如关系数据库系统、事务处理系统和文件系统)区别开来。让我们进一步看看这些关键特征。面向主题的(subject-oriented):数据仓库围绕一些主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理。因此,数据仓库排除对决策无用的数据,提供特定主题的简明视图。集成的(in 阅读全文
posted @ 2011-07-15 10:34 honkcal 阅读(1509) 评论(0) 推荐(0) 编辑
摘要: 对于传统的业务处理(OLTP)系统,我们总是按照业务应用来建立它的模型,换言之, 业务处理系统是面向应用来设计的,更准确地说是面向交易来设计。而数据仓库则一般按照主题(Subject)来建模, 它是面向主题的。何谓应用? 何谓主题? 让我们来看一个简单的例子。在银行中, 一般都有对私 (个人储蓄)、对公 (企业储蓄)、信用卡等多种业务系统, 它们都是面向相关业务应用设计的交易处理系统, 系统主要任务是完成业务交易过程中的数据处理,数据库在设计的时候主要是围绕性能和完整性方面,而每个交易涉及的数据往往只是记录的层面,数据库设计主要考虑并行更新方面比较多,并不需要考虑为全表范围的查询做优化,而系统 阅读全文
posted @ 2011-07-15 10:16 honkcal 阅读(1141) 评论(0) 推荐(0) 编辑