2017.06.29数据挖掘基础概念第四章

第四章
39、为什么在进行联机分析处理(OLAP)时,我们需要一个独立的数据仓库,而不是直接在日常操作的数据库上进行
1、提高两个系统的性能 2、操作数据库支持多事务的并发处理,需要并发控制和恢复机制,确保一致性和事务的鲁棒性
3、两者有着不同的数据的结构、内容和用法
40、什么是数据仓库
数据仓库是一种数据库,它与单位的操作数据库分别维护,数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持,是一个面向主题的、集成的、时变得、非易失的数据集合,支持管理者的决策过程。
41、数据仓库的构建需要
1、数据集成 2、数据清理 3、数据统一
42、单位如何使用数据仓库的信息
1、提高顾客关注度,这包括顾客购买模式
2、根据按季度、按年、按地区的营销情况比较,重新配置产品和管理产品的投资,调整生产策略。
3、分析运作情况并找出利润源
4、管理客户联系,进行环境调整,管理公司的资产开销
43、OLTP(联机事务处理)和OLAP(联机分析处理)的主要区别
1、用户和系统的面向性:OLTP是面向顾客的 OLAP面向市场的
2、数据内容:OLTP系统管理当前数据 OLAP系统管理大量的历史数据
3、数据库设计:OLTP采用实体-联系数据模型和面向应用的数据库设计 OLAP通常采
用星形或雪花模型和面向主题的数据库设计
4、视图:OLTP系统主要关注一个企业或部门内部的当前数据,而不涉及历史数据或不
同单位的数据 OLAP系统处理来自不同单位的信息,以及多个数据库集成的信息。
5、 访问模式:OLTP系统的访问主要由短的原子事务组成,OLAP系统的访问大部分是只读操作
44、数据仓库的三层体系结构
1、底层是仓库数据库服务器 2、中间层是OLAP服务器 3、顶层是前端客户层
45、数据仓库模型
1、企业仓库:企业仓库搜集了关于主题的所有信息,跨越整个企业
2、数据集市:数据集市包含企业范围数据的子集,对特定的用户群是有用的
3、虚拟仓库:操作数据库上视图的集合
46、数据仓库开发的自顶向下和自底向上的优缺点是什么?
自顶向下开发企业仓库是一种系统的解决方案,并能最大限度地减少集成问题。然而,它费用高,开发周期长,并且缺乏灵活性,因为整个组织就共同数据模型达成一致时比较困难的。设计、开发、配置独立的数据集市的自底向上的方法提供了灵活性、低花费,并能快速回报投资。然而,将分散的数据集市集成,形成一个一致的企业数据仓库时,可能导致问题。
47、数据仓库系统使用工具和程序的功能
1、数据提取 2、数据清理 3、数据变换 4、装入 5、刷新
48、元数据库包括的内容:
1、数据仓库结构描述 2、操作元数据 3、用于汇总的算法
4、由操作环境到数据仓库的映射 5、关于系统性能的数据 6、商务元数据
49、在OLAP中,如何使用概念分层
在多维数据模型中,数据组织在多维空间,每维包含由概念分层定义的多个抽象层。这种组织为用户从不同角度观察数据提供了灵活性
50、典型的OLAP操作方法
1、上卷 2、下钻 3、切片和切块
4、转轴 5、其他OLAP操作 6、OLAP系统与统计数据库

posted @ 2017-06-29 22:07  小春熙子  阅读(246)  评论(0编辑  收藏  举报