摘要: Analysis1. What is a logical data mapping and what does it mean to the ETL team?什么是逻辑数据映射?它对ETL项目组的作用是什么?答:逻辑数据映射(Logical Data Map)用来描述源系统的数据定义、目标数据仓库... 阅读全文
posted @ 2015-06-22 19:20 JackyKen 阅读(2326) 评论(0) 推荐(0) 编辑
摘要: 维度表中的主键通常有两种选择:自然键(Natural Key),它是业务系统中已经存在的,通常是具有一定业务含义的一个字符型的标志符,可以唯一地标志维度表中的每一条记录。比如机构的代码、缩写、时间标签等。另一种是代理键(Surrogate Key),通常是数据库系统赋予的一个数值,是自增型的,按... 阅读全文
posted @ 2015-06-22 18:55 JackyKen 阅读(861) 评论(0) 推荐(0) 编辑
摘要: 凡是建设数据仓库,一定会提到维度建模方法。这一方法是Kimball最先提出的,其最简单的描述就是,按照事实表、维度表来构建数据仓库、数据集市。在维度建模方法体系中,维度是描述事实的角度,如日期、商品、地址等,事实是要度量的指标,如用户数、销售额等。按照一般书籍的介绍,维度建模还会分为星型模型、雪花模... 阅读全文
posted @ 2015-06-22 18:27 JackyKen 阅读(2568) 评论(1) 推荐(0) 编辑
摘要: Ralph Kimball是数据仓库和商务智能领域的权威专家。作为一名最早的数据仓库架构师,他长期以来一直坚信数据仓库的设计必须遵循易于理解和快速反应的准则。他创立的维度建模方法论(或Kimball方法论)已经成为决策支持领域的金科玉律。相较于数据仓库的其他领先架构(Bill Inmon的架构),K... 阅读全文
posted @ 2015-06-22 18:15 JackyKen 阅读(921) 评论(0) 推荐(0) 编辑
摘要: 这几天研究了一家美国的大数据公司1010data,它在产品白皮书中提出了新一代数据仓库的概念(NEXT-GENERATION DATA DISCOVERY),相对于第一代数据仓库,具有如下一些特征:l用户可以针对任何问题进行分析和查询,也就是说,分析系统要提供更加友好的操作体验,更加明细的数据粒度;... 阅读全文
posted @ 2015-06-22 18:11 JackyKen 阅读(1650) 评论(0) 推荐(0) 编辑