Chao - Testing

testing testing and testing

导航

随笔分类 -  数据仓库

data warehousing
Ralph Kimball处理慢速变化维的方法
摘要:One major difference between an OLTP system and a data warehouse is the ability to accurately describe the past. OLTP systems are usually very poor at correctly representing a business as of a month o... 阅读全文

posted @ 2004-11-06 18:45 Chech 阅读(663) 评论(0) 推荐(0)

一个开源的ETL工具
摘要:Octopus is a simple Java-based Extraction, Transformation, and Loading (ETL) tool. It may connect to any JDBC data sources and perform transformations defined in an XML file. DODS data model... 阅读全文

posted @ 2004-10-30 17:03 Chech 阅读(5146) 评论(3) 推荐(0)

The Java Data Mining API[转]
摘要:by Benoy Jose Introduction:Data Mining is a very important process used by most companies today. It includes sifting through tons of business data for potential leads, sales analysis, audit, data ... 阅读全文

posted @ 2004-10-25 04:58 Chech 阅读(1002) 评论(0) 推荐(0)

JDM初体验(一)环境
摘要:在dwblog看到Java Data Mining规范 (JSR-73)发布 ,于是兴冲冲跑去尝试一下,从JCP的页面 上把这个jsr73的包当下来,解开之后又是几个压缩包,照着readme分别解开,安置到位,发现还需要到www.junit.org下载一个junit(目前为止还没派上用场),统统搞定,目录结构如下:JDM|+-- libs : junit.jar, jdmTCK.jar, jd... 阅读全文

posted @ 2004-10-24 02:40 Chech 阅读(1130) 评论(3) 推荐(0)

数据仓库中的一些争议之我见(一)
摘要:Ralph Kimball的dimensional modeling 为基础的结构和Inmon的以ER model为基础的结构是当前数据仓库的两种主流理论. Ralph经常在他的著作中提到一些对数据仓库的misunderstanding,很明显都是针对Inmon的理论,而Inmon的支持者们也经常指责dimension模型的不足.事实上,两种理论对数据仓库的定义和理解就不同,这也是... 阅读全文

posted @ 2004-10-20 03:51 Chech 阅读(1564) 评论(7) 推荐(0)

什么是数据仓库[转]
摘要:(转载自北大高科网站) 目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的... 阅读全文

posted @ 2004-10-19 02:38 Chech 阅读(1272) 评论(6) 推荐(0)

无责任数据仓库图书简评 [转]
摘要:转自 Fenng数据仓库近来成了很多IT人的话题。在ERP、CRM之后忽然间出来个一个BI,说到BI不能不提DW(数据仓库)。现在书店里数据仓库的书籍并不是很多,有的还比较陈旧,笔者在这里把自己对一些数据仓库图书的印象罗列出来,供读者参考。主观印象比较重,有不恰当的地方请多指教。 当然有一点要说明的是,对于数据仓库这种偏重实施性的项目,仅有图书是没有用的,更多的时候还要靠项目经验. ---... 阅读全文

posted @ 2004-10-19 02:35 Chech 阅读(604) 评论(0) 推荐(0)

数据仓库的数据存储 [转]
摘要:转自 yangwl 1、数据存储的方式? 数据仓库的数据由两种存储方式:一种是存储在关系数据库中,另一种是按多维的方式存储,也就是多维数组。2、存储何种数据? 数据仓库中存在不同的综合级别的数据。一般把数据分成四个级别,早期细节级数据,当前细节级数据,轻度综合级,高度综合级。不同的综合级别一般称为粒度。粒度越大,表示细节程度越低,综合程度越高。级别的划分是根据粒度进行的。 ... 阅读全文

posted @ 2004-10-19 02:32 Chech 阅读(1582) 评论(0) 推荐(0)

数据仓库USEFUL LINKS(不断更新中)
摘要:数据仓库之路: 很多很有价值的文档,不过要成为高级会员才能下载,论坛也不错BRIO技术论坛 : 刚找到的论坛Links list on IMS5024: a list of related sites 阅读全文

posted @ 2004-10-19 02:30 Chech 阅读(478) 评论(0) 推荐(0)

Data Warehouse Architectures in an Internet Age
摘要:In designing a data warehouse (DW), there are several key decisions that have to be right for the DW to be a success. One of the most important of these decisions concerns the architecture of the DW. ... 阅读全文

posted @ 2004-10-19 02:14 Chech 阅读(462) 评论(0) 推荐(0)