摘要: 1。维度就是坐标系上就坐标轴,比如时间,部门,2。度量值就是能在报表里面反应出来的数据,比如你要小时员工的工资 那么工资就是度量值3。事实表就是要被分析的表,里面的一条记录字段包括了维度的一个值 ,度量值 阅读全文
posted @ 2011-07-18 18:13 honkcal 阅读(999) 评论(0) 推荐(0) 编辑
摘要: 2009-11-30 13:30 48人阅读 评论(0) 收藏 举报Extract :抽取Transformation :转换Loading : 加载理解SSIS的控制流和数据流控制流是整个工作流程而数据流是控制流中的一部分典型业务场景:1. 门店结帐之后,把当天Pos机的数据,通过ftp方式发送给总公司2. SSIS需要按照下面的步骤完成导入工作2.1 下载FTP文件夹里面所有的文件(FTP Task)2.2 在本地先进行一些基本的校验(资源管理器任务)2.3 循环(Foreach循环容器)本地这个文件夹,对每一个文件执行一次导入操作(Data Flow)2.4 如果某个文件导入失败, 阅读全文
posted @ 2011-07-18 18:00 honkcal 阅读(452) 评论(0) 推荐(0) 编辑
摘要: 上午1.知识回顾重点回顾SSAS的知识数据源:身份模拟的意思是什么?应该如何选择数据源视图:这里能做什么事情?命名计算,友好名称,关系。命名查询多维数据集中为什么要单独选择一个时间维度?如果在向导中没有选择,那么该怎么办层次结构为什么需要,具体做法方便用户导航提高性能做完层次结构的时候,需要做两件事情设置Attribute的 Visible属性为false,即让用户只能通过我们的层次结构来导航设置Level之间的关系多维数据集为什么显示有的表既是事实表又是维度表退化维度物理维度表和逻辑维度表的意思是什么物理维度是全局,共享的。逻辑维度是针对Cube的一种映射。一个物理维度可以映射多个逻辑维度。 阅读全文
posted @ 2011-07-18 17:59 honkcal 阅读(884) 评论(0) 推荐(0) 编辑
摘要: 1. 创建数据源(必须的)把项目中可能用到的数据仓库的连接设置好通常是数据仓库注意:身份模拟的设置如果仓库和SSAS是一个服务器,可以直接使用服务帐号否则,可以指定特定的用户名和密码2. 创建数据源视图(必须的)把项目中可能用到的一些维度表和事实表映射成一个视图经验做法:先选择事实表,然后“添加相关表”还可以做一些附加的操作修改友好名称添加命名计算(在原先的数据库字段基础上,再派生一些字段)修改关系(如果仓库中没有关系,可以通过在这里建立关系来实现)如果表仍然比较多,可以通过创建不同的视图来简化3. 创建多维数据集两种主要的模型:根据仓库自动生成(最方便)选择数据源视图选择事实表和维度表重点要 阅读全文
posted @ 2011-07-18 17:58 honkcal 阅读(440) 评论(0) 推荐(0) 编辑
摘要: SQL Server数据库维度表和事实表概述:事实表每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性纬度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据。包含在事实数据表中的“度量值”有两中:一种是可以累计的度量值,另一种是非累计的度量值。最有用 阅读全文
posted @ 2011-07-18 17:23 honkcal 阅读(3490) 评论(0) 推荐(0) 编辑
摘要: 1 切片和切块(Slice and Dice)在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“贷款银行、贷款质量、时间”三维立方体中进行切块和切片,可得到各贷款银行、各种贷款的统计情况。每次都是沿其中一维进行分割称为分片,每次沿多维进行的分片称为分块。2、钻取(Drill)钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作, 钻取的深度与维所划分的层次相对应。3 旋转(Rotate)/转轴(Pivot)通过旋转可以得到不同视角的数据 阅读全文
posted @ 2011-07-15 11:26 honkcal 阅读(8557) 评论(0) 推荐(0) 编辑
摘要: 1 OLAP 分析OLAP 分析,又称多维分析,使分析人员能够从多个角度对从原始数据中转化出来的、能够真正为用户所理解的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP 也可以简单定义成使用户能够以多维视图分析数据的工具。管理人员往往希望从不同的角度来审视业务情况,比如从时间、地域、产品、客户等来看收入、利润、支出等业务统计数字。每一个分析的角度可以叫做一个维,因此,我们把多角度分析方式称为多维分析。以前,每一个分析的角度需要制作一张报表。在线多维分析工具的主要功能,是根据用户常用的多种分析角度,事先计算好一些辅助结构,以便在查询时能尽快访问到所要的汇总数字, 阅读全文
posted @ 2011-07-15 11:19 honkcal 阅读(5619) 评论(1) 推荐(0) 编辑
摘要: 1、粒度粒度是数据仓库的重要概念。粒度可以分为两种形式,第一种粒度是对数据仓库中的数据的汇总程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能回答询问信息的种类。在数据仓库中,多维粒度是必不可少的。由于数据仓库的主要作用是多维分析,因而绝大多数查询都基于一定程度的汇总数据之上的,只有极少数查询涉及到细节。还有一种粒度形式,即样本数据库。它根据给定的采样率从细节数据库中抽取出一个子集。这样样本数据库中的粒度就不是根据汇总程度的不同来划分的,而是有采样率的高低来划分,采样粒度不同的样本数据库可以具有相同的数据汇总程度。2、分割分割是数据仓库中的数据存储中的另外一个重要概念,它 阅读全文
posted @ 2011-07-15 10:59 honkcal 阅读(694) 评论(0) 推荐(0) 编辑
摘要: 逻辑建模是数据仓库实施中的重要一环, 因为它能直接反映出决策者管理者的需求, 同时对系统的物理实施有着重要的指导作用。目前较常用的包含有星型模式。星型模式是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimens ion Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称为事实 (Fact),它们一般都是数值或其他可以进行计算的数据; 而维大都是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不同的维(事实表的主键的部分或全部)来对这些事实数据进行求和(summary)、求平均(average)、计数(co 阅读全文
posted @ 2011-07-15 10:54 honkcal 阅读(2153) 评论(0) 推荐(1) 编辑
摘要: 按照W.H.Inmon 这位数据仓库权威的说法,“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。这个简短而又全面的定义指出了表明数据仓库主要特征的四个关键词:面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统(如关系数据库系统、事务处理系统和文件系统)区别开来。让我们进一步看看这些关键特征。面向主题的(subject-oriented):数据仓库围绕一些主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理。因此,数据仓库排除对决策无用的数据,提供特定主题的简明视图。集成的(in 阅读全文
posted @ 2011-07-15 10:34 honkcal 阅读(1505) 评论(0) 推荐(0) 编辑
摘要: 对于传统的业务处理(OLTP)系统,我们总是按照业务应用来建立它的模型,换言之, 业务处理系统是面向应用来设计的,更准确地说是面向交易来设计。而数据仓库则一般按照主题(Subject)来建模, 它是面向主题的。何谓应用? 何谓主题? 让我们来看一个简单的例子。在银行中, 一般都有对私 (个人储蓄)、对公 (企业储蓄)、信用卡等多种业务系统, 它们都是面向相关业务应用设计的交易处理系统, 系统主要任务是完成业务交易过程中的数据处理,数据库在设计的时候主要是围绕性能和完整性方面,而每个交易涉及的数据往往只是记录的层面,数据库设计主要考虑并行更新方面比较多,并不需要考虑为全表范围的查询做优化,而系统 阅读全文
posted @ 2011-07-15 10:16 honkcal 阅读(1140) 评论(0) 推荐(0) 编辑
摘要: when data is loaded into a mulitdimensional OLAP database , metadata is added to the data. Metadata is data about the data.The metadata in an OLAP database includes information about relationships and hierarchies in the data ,how the data should be sorted and summarized ,and how it should be formatt 阅读全文
posted @ 2011-07-14 18:26 honkcal 阅读(264) 评论(0) 推荐(0) 编辑