05 2011 档案

摘要:Oracle OLAP的历史 Oracle OLAP的历史可谓悠久. Oracle在1995年从IRI手上买下Express产品时, Express已经是一个很强大的多维数据分析工具包了. Express被收购之后, 被命名为Oracle Express, 刚开始Oracle Express是一个独立的软件包, Oracle 9i开始作为OLAP Option集成在Oracle数据库内, 随着Oracle 10g/11g的发布, OLAP option更加成熟, 尤其是Oracle 11g. 如何创建和维护 Oracle OLAP cube 1. Analytic Workspace Mana 阅读全文
posted @ 2011-05-19 07:14 harrychinese 阅读(4970) 评论(0) 推荐(0) 编辑
摘要:朋友电话要我推荐一个Windows下的DWBI产品线, 强调要容易上手. 给他写了点东西, 同步放在博客上了. 目前只有4家公司, 能提供端到端的DWBI方案(包括database, ETL, Reporting, Data mining), 分别是Oracle, 微软, IBM和SAP. 如果在Windows环境下, 那自然首推微软了, 特点是: 容易开发, 维护简单, 总体拥有成本比较低. 另外, 微软还有别的公司不具备的武器, 就是Excel, 可以使用Excel来获取SQL Server Analysis Service的分析数据, 这直接拉近了BI和业务人员的距离. 当然, 也可以组 阅读全文
posted @ 2011-05-13 21:35 harrychinese 阅读(444) 评论(0) 推荐(0) 编辑
摘要:前几天有朋友咨询在数据仓库Stage或ODS层该如何保存历史数据, 他的这个问题其实很普遍, 所以写了点东西放在博客上. 一般数据仓库项目中, Stage或ODS层要保留几天或几个月的源表数据. 保留历史业务数据是很必要的, 有时候需要DWH重跑某一天的数据, 这种情况下, 无法从前端OLTP系统取的当时的数据. 在比如, 需要DWH在一天内要回跑多天batch, 这在项目刚上线时经常碰到. 至于是在Stage层还是ODS层保留历史数据, 我一般推荐是在Stage层保留历史, 让ODS只保留当天的快照数据. 因为Stage保留的是最原始的数据. 那如何保留一个表(比如TA表)的历史数据呢? 我 阅读全文
posted @ 2011-05-11 21:40 harrychinese 阅读(550) 评论(1) 推荐(0) 编辑
摘要:前面我写了个博客记录如何去重一个oracle表(link), 主要是利用了oracle的rowid伪列和row_number()分析函数. 有读者写邮件问, 如何去重一个SQL Server表, 场景和前面文章一样, 即: 有部分字段有重复值, 表结构中没有一个能唯一定位的ID列, 也不允许修改表结构. 下面我给了个基本的思路. --步骤0, 根据原表table_a, 创建一个临时表table_a_temp, 仅仅增加了一个自增列row_id, 原因是SQL Server没有类似Oracle的rowid伪列, 我们就自己造一个. --假设原表的结果为: create table table_a 阅读全文
posted @ 2011-05-09 21:42 harrychinese 阅读(880) 评论(0) 推荐(0) 编辑
摘要:前几天, 有人要我列几个DWBI项目成功关键因素? 老实讲, 这个问题以前没有特别想, 因为我觉得很清楚. 现在回头想想, 我当时讲的不是很系统. 一点体会: 有时候认为自己已经对一个东西很懂, 没有必要再花时间在这个上面, 其实所谓很懂, 也就是脑袋里有一些孤立的点. 看来还是需要落实到文字, 写的过程也是一个梳理的过程. 下面列了几个成功关键点, 排列次序不代表重要度, 做DWBI的都应该清楚, 每一点都很重要, 如果有一个没有做好, 项目就可能失败. 1. 项目的目标和范围要清晰, 同时要有严格的Change Request控制, 防止需求膨胀. 2. 项目团队密切协作, PM+架构师+ 阅读全文
posted @ 2011-05-06 21:38 harrychinese 阅读(633) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示