Data Mining --- DataWareHouse
一、数据仓库
定义:面向主题、集成的、时变的、非易失的数据集合,并支持管理决策。
数据仓库(联机分析处理OLAP)VS 数据库系统(联机事务处理OLTP):OLTP面向顾客用于查询处理,OLAP面向分析员用于数据分析;OLTP管理当前数据,OLAP管理大量历史数据;OLTP采用ER模型,OLAP采用星形或雪花模型。
OLAP操作:上卷、下钻、切片、转轴。
三层数据仓库结构:底层数据仓库服务器、中间层OLAP服务器、顶层客户。
索引OLAP数据:位图索引。相比散列与树索引,位图索引把比较连接聚集等操作变成位运算,减少运行时间;字符串用位表示降低了空间和I/O开销。