数据仓库
数据仓库
前言
通过商务智能(Business Intelligence,BI)可以将企业多年累积的数据加以利用,不仅能够为企业管理好这些海量数据,而且能挖掘出数据潜在的价值。BI包括三种技术:数据仓库(DW,Data Warehouse)技术,联机分析技术(OLAP)和数据挖掘技术。其中数据仓库是核心。
问题
1、 试述数据库和数据仓库的区别
对比内容 |
数据库 |
数据仓库 |
数据内容 |
当前值 |
历史的,存档的,归纳的,计算的数据 |
数据目标 |
面向业务操作程序,重复处理 |
面向主题域,管理决策分析 |
数据特性 |
动态变化,按字段更新 |
静态,不能直接更新,只定时添加 |
数据结构 |
高度结构化,复杂,适合操作计算 |
简单,适合分析 |
使用频率 |
高 |
中到低 |
数据访问量 |
每个事务只访问少量记录 |
有的事务可能要访问大量记录 |
对响应时间的要求 |
以秒为单位计量 |
以秒、分钟甚至小时为计量单位 |
2、 简述数据仓库的定义
数据仓库是DSS(决策支持系统Decision support system,DSS)和OLAP(联机分析处理)应用数据源的结构化数据环境,用于支持管理和决策,面向分析型数据处理。特征有:面向主题,相对稳定,集成,反映历史变化。
3、 简述数据仓库的基本组成
4、 OLTP与OLAP的区别与联系
OLTP |
OLAP |
原始的细节性数据 |
导出的综合性数据 |
当前数据 |
历史数据 |
可更新 |
不可更新 |
一次处理的数据量小 |
一次处理的数据量大 |
面向应用,事务驱动 |
面相分析,分析驱动 |
面向操作人员,支持日常操作 |
面向决策人员,支持管理需要 |
5、 试述数据源的定义、作用与种类
6、 OLAP的基本操作有哪些
钻取:改变维的层次,变换维的粒度
切片:在多位数组上选定一维成员
切块:在多维数组的某一维选定某一区间的维
旋转:通过旋转可以得到不同视角的数据。
7、 简述OLAP数据模型的实现
见贤思齐焉,见不贤而内自省也。