以前系统学习过数据仓库,今天重新复习下
数据仓库
1.面向主题的:在较高层次上将企业信息系统的数据综合归并分析利用的抽象的概念.每个主题基本上对应一个相应的分析领域
2.集成的:企业级别数据,同时数据要保持一致性(在数据库可以存在A,M,男,但是数据仓库必须一致性只有一种表示方式),完整性,有效性,精确性(公司一般有多个数据库,多套系统,在企业角度想看到全量的数据,就必须集成到一起)---数据通道(把数据采集,集成到仓库中)
3.稳定的:从某个时间来看保持不变的,没有更新操作,删除操作,以查询分析为主(数仓可以追踪某个用户在某一个时刻的状态,但是数据库不行,因为业务系统会一直在更改的,但是数仓是稳定的不变的,业务系统存在事务处理,反应当前一个状态.数据仓库反应的是历史状态)
4.变化的:反应历史变化
数据仓库数据包括(文档数据--非结构化数据,仓库系统,订单系统,财务系统,。。。。)
功能 数据仓库 数据库
数据范围 存储历史数据,完整的,反应历史变化的 当前状态数据
数据变化 可添加,无删除,无变更的,反应历史变化的 支持频繁的CRUD操作
应用场景 面向分析,支持战略决策的 面向业务交易流程
设计理论 违范式,适当 冗余 遵照范式(第一,第二,第三等范式),避免 冗余
处理量 非频繁,大批量,高吞吐,有延迟 频繁,小批次,高并发,低延迟
面向业务数据库通常称为OLTP(联机事务处理),面向分析的数据仓库称为OLAP(联机分析处理)