总体框架:异构数据源->数据抽取->数据仓库->多维数据库->前端展示

基础评估:历史数据集中及分布情况、数据的异构程度、数据的准确性与一致性情况、数据仓库规模与容量(预测硬件投资)、网络状况、集中or分布式

建立数据仓库:

§前提:解基础系统的数据结构,

§核心:建立商业数据模型(BDM),它是整个系统的基础,严重影响系统的可扩展性

§关键:建立保证数据完整性、一致性的策略

数据仓库的本质是“数据”以及“数据的关系”

建立多维分析数据库:

§前提:挖掘用户的分析需求

§核心:建立多维分析数据模型(MADM),需充分调整模型的性能、模型的存储优化、缩短模型预处理所花的时间

§关键:系统的前瞻性,维的丰富度,结构的平衡

建立数据抽取系统:

指导思想:工作流。步骤:获取->过滤->清洗->校验->转换->装载

特点:非过程化、高效性、易维护性、增量、自动管理、出错策略、可恢复、历史数据的修改

posted on 2009-02-28 21:23  文圆质芳  阅读(253)  评论(0编辑  收藏  举报