博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

随笔分类 -  06数据仓库与建模

摘要:根据模型的设计和源数据的情况,有四种数据ETL模式:完全刷新、镜像增量、事件增量、镜像比较 根据模型的设计和源数据的情况,有四种数据ETL模式: 完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本... 阅读全文

posted @ 2008-05-01 11:00 徐正柱- 阅读(1381) 评论(0) 推荐(0) 编辑

摘要:在数据仓库的设计指导思想中,数据仓库的概念定义是非常重要的,数据仓库概念规定了数据仓库所具有的几个基本特性,这些特性也正是对数据仓库设计结果进行检验的重要依据。 在一般的数据仓库应用系统中,根据系统体系结构的不同,数据仓库设计的内容和范围不尽相同,并且设计方法也不尽相同,下面的两幅图示分别表示... 阅读全文

posted @ 2008-05-01 10:58 徐正柱- 阅读(763) 评论(0) 推荐(0) 编辑

摘要:数据仓库系统是一个与企业同步发展的有机体,数据模型作为数据仓库的灵魂必须提供可扩展的能力,在进行数据模型设计时必须考虑未来的发展,更多的非核心业务数据可以方便的加入到数据仓库,而不需要对数据仓库中原有的系统进行大规模的修改。 一、数据仓库建模的原则 模型是对现实事物的反映和抽象,它可以帮助我们更加清晰的了解客观世界。数据仓库建模在业务需求分析之后开始,是数据仓库构造工作正式开始的第一步,正确... 阅读全文

posted @ 2008-05-01 10:56 徐正柱- 阅读(853) 评论(0) 推荐(0) 编辑

摘要:数据仓库是一项基于数据管理和运用的综合性技术和解决方案。数据仓库的成功实施对培育一种知识共享文化产生重大影响。目前,基于数据仓库的决策支持系统还主要应用于银行业和证券业。 随着全球性竞争的加剧,越来越多的企业认识到正确及时的决策是企业生存和发展的关键所在。因此,充分利用现代信息科技技术,自动快速获取有用的决策信息,为企业提供快速、准确的决策支持,已成为大多数成功企业的共识。 数据仓... 阅读全文

posted @ 2008-05-01 10:54 徐正柱- 阅读(769) 评论(0) 推荐(0) 编辑

摘要:本文讨论了数据仓库模型设计中常用的两种方法。在数据仓库的应用环境中,主要有两种负载:一种是回答重复性的问题;另一种是回答交互性的问题。动态查询具有较明显的交互性特征,这种交互过程常称为数据挖掘或知识探索。 数据仓库模型的特点 对于传统的OLTP系统,我们总是按照应用来建立它的模型,换言之,OLTP系统是面向应用的。而数据仓库则一般按照主题 (Subject)来建模,它是面向主题的。何谓... 阅读全文

posted @ 2008-05-01 10:51 徐正柱- 阅读(714) 评论(0) 推荐(0) 编辑

摘要:BI(Business Intelligence) 是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。从定义上我们要明白BI运行的基础是 :数据仓库,和联机分析 ,数据挖掘;目的:提供决策支持 最近想学习BI,因为自己做的一个项目用到了大量Oracle 分析函数,而烃使用使用OLAP技术,系统目前数据量少,速度相对来说可以。每... 阅读全文

posted @ 2008-05-01 10:47 徐正柱- 阅读(2063) 评论(0) 推荐(0) 编辑

摘要:通过webcast我知道了微软提供了三种数据挖掘模型查看器的编程控件,并且是开放源码的,可惜都是webform的,不适合于我的应用场景。我想能不能把webform的源码改造成winform的控件,但是我对挖掘模型本身的理解不透,去改造这种代码,等于给自己的项目埋下地雷 注意:对于本文提到的dll,因为微软没有公布,建议不要用于真实项目中去。否则以后使用中出现问题,将变的非常被动,本文仅作学习之用... 阅读全文

posted @ 2008-05-01 10:45 徐正柱- 阅读(439) 评论(0) 推荐(0) 编辑

摘要:事实上我们已经存在一个简单的数据分析系统了,只不过这个是以前人家做的,没有采用sqlserver2005的BI平台来做,而是直接写winform程序来弄的。原来的数据抽取是主站那边提供导出的excel文件过来,然后到我们这边,导入到我们的分析库中去。 前文回顾:Sqlserver BI--数据仓库设计 这节我们主要讲讲我的游戏交易数据分析项目的ETL(数据抽取、加载、转换)具体是怎么做的。 先... 阅读全文

posted @ 2008-05-01 10:42 徐正柱- 阅读(579) 评论(0) 推荐(0) 编辑

摘要:在我们这个系统里面,我们的数据颗粒度是天。好了,既然是简化版,我们也就不用那么罗嗦,什么需求分析,分析设计都省了吧,下面直接进入数据库设计。我们的数据库一共包括四张维度表(部门维度,游戏维度,物品维度,时间维度),一张事实表(游戏交易数据事实表)。 因为项目还没有真正开始,但是接触BI已有半年多,手痒,这几天准备搞一个简化版本的BI项目。一方面给刚BI入门的朋友一个参考,另外一方面也为自己的将... 阅读全文

posted @ 2008-05-01 10:39 徐正柱- 阅读(764) 评论(0) 推荐(0) 编辑