数据仓库 - 1.数据仓库系统及特点

一、联机事务处理系统(OLTP系统)

也称为生产系统,它是事件驱动、面向需求的,比如银行的储蓄系统就是一个典型的OLTP系统。OLTP在使用过程中积累了大量的数据。关系数据库概念提出之后,联机事务处理一直是数据库应用的主流。

OLTP的特点是:1)对相应时间要求非常高;2)用户数量非常庞大,主要是操作人员;3)数据库的各种操作基于索引进行,每次操作数据量很小。

二、联机分析处理系统(OLAP系统)

是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分,它是数据驱动、面向分析的。OLAP系统是跨部门、面向主题的。

OLAP的特点:1)基础数据来源于生产系统的操作数据;2)对系统的相应时间合理;3)用户数量相对较少,其用户主要是业务决策人员与管理人员。

三、建立数据仓库的三个基本条件

1)该行业有较为成熟的联机事务处理系统,它为数据仓库提供业务分析的客观条件和数据来源(也就是说这个行业要有大量的数据);

2)该行业面临市场竞争的压力,需要通过数据分析服务业务,它为数据仓库的建立提供外在的动力;

3)该行业为数据密集型行业,比如金融,供应链等。

四、数据仓库的四个特点

数据仓库的概念由被誉为“数据仓库之父”的 William H. Inmon 博士提出的:数据仓库是一个面向主题的、集成的、随时间变化的、信息相对稳定的数据结合,它用于对企业管理和决策提供支持。

1)面向主题。

所谓主题是指用户使用数据仓库进行决策时所关心的重点方面,如:客户、产品、财务、事件、服务使用、资源、客户服务、地域等;所谓面向主题是指数据仓库内的信息是按照主题进行组织的,而不是像业务支撑系统那样是按照业务功能进行组织的;分析和明确企业所涵盖的业务范围,并且对企业业务进行高度概括性的描述,把密切相关业务对象进行归类,它没有统一的标准,主要根据设计这的经验。不同的行业有不同的主题域划分方式。(常用方法:谁在什么时间什么地点做了什么事)

2)数据集成

指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,必须消除源数据中的不一致性,因此数据仓库中的信息是关于整个企业的一致的全局信息。

各个业务系统可能由不同的厂家独立承建,他们的数据模型设计、编码规则等都是不同的,这些数据加载到数据仓库之后,需要进行一个加工转换的过程。BOSS系统中,拿地方的编码来说:451、452等,那么在数据仓库中,需要将各个业务系统中相同含义的数据通过规则映射为同一个编码。

3)随时间变化而变化

指数据仓库内的信息并不只是反映企业当前的信息,而是记录了从过去某一时点到当前各个阶段的信息。通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测;业务系统只记录当前的最新状态,数据仓库中可以反应一个用户的状态变化过程以及分析变化的原因。

 4)数据相对稳定

指一旦某个数据进入数据仓库以后,一般很少进行修改,更多的是对信息进行查询操作,通常只需要进行定期的加载和刷新。

数据仓库中几乎很少对历史数据进行修改,比如6月2日用户单停,那么在天这个粒度上的数据就是本日的最终单停的这个状态;而对于业务系统中,它总是最新的状态,所以业务系统中的数据总是不断变化的。

(若出现业务审核情况造成的数据有效性加载,或者业务在审核过后指标才会出现,这种情况通常需要和客户进行确认,指标到底是计算在制单日还是审核日,我们应该尽量避免对进入数据仓库的数据进行UPDATE操作,同时在设计这种UPDATE操作的时候,我们也要想好可能的回退方案,一旦数据出错要能够恢复到更新前的数据。)

posted @ 2018-06-13 23:22  Like_Moon  阅读(1298)  评论(0编辑  收藏  举报