摘要:One major difference between an OLTP system and a data warehouse is the ability to accurately describe the past. OLTP systems are usually very poor at correctly representing a business as of a month o...
阅读全文
摘要:Octopus is a simple Java-based Extraction, Transformation, and Loading (ETL) tool. It may connect to any JDBC data sources and perform transformations defined in an XML file. DODS data model...
阅读全文
摘要:by Benoy Jose Introduction:Data Mining is a very important process used by most companies today. It includes sifting through tons of business data for potential leads, sales analysis, audit, data ...
阅读全文
摘要:在dwblog看到Java Data Mining规范 (JSR-73)发布 ,于是兴冲冲跑去尝试一下,从JCP的页面 上把这个jsr73的包当下来,解开之后又是几个压缩包,照着readme分别解开,安置到位,发现还需要到www.junit.org下载一个junit(目前为止还没派上用场),统统搞定,目录结构如下:JDM|+-- libs : junit.jar, jdmTCK.jar, jd...
阅读全文
摘要:Ralph Kimball的dimensional modeling 为基础的结构和Inmon的以ER model为基础的结构是当前数据仓库的两种主流理论. Ralph经常在他的著作中提到一些对数据仓库的misunderstanding,很明显都是针对Inmon的理论,而Inmon的支持者们也经常指责dimension模型的不足.事实上,两种理论对数据仓库的定义和理解就不同,这也是...
阅读全文
摘要:(转载自北大高科网站) 目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的...
阅读全文
摘要:转自 Fenng数据仓库近来成了很多IT人的话题。在ERP、CRM之后忽然间出来个一个BI,说到BI不能不提DW(数据仓库)。现在书店里数据仓库的书籍并不是很多,有的还比较陈旧,笔者在这里把自己对一些数据仓库图书的印象罗列出来,供读者参考。主观印象比较重,有不恰当的地方请多指教。 当然有一点要说明的是,对于数据仓库这种偏重实施性的项目,仅有图书是没有用的,更多的时候还要靠项目经验. ---...
阅读全文
摘要:转自 yangwl 1、数据存储的方式? 数据仓库的数据由两种存储方式:一种是存储在关系数据库中,另一种是按多维的方式存储,也就是多维数组。2、存储何种数据? 数据仓库中存在不同的综合级别的数据。一般把数据分成四个级别,早期细节级数据,当前细节级数据,轻度综合级,高度综合级。不同的综合级别一般称为粒度。粒度越大,表示细节程度越低,综合程度越高。级别的划分是根据粒度进行的。 ...
阅读全文
摘要:数据仓库之路: 很多很有价值的文档,不过要成为高级会员才能下载,论坛也不错BRIO技术论坛 : 刚找到的论坛Links list on IMS5024: a list of related sites
阅读全文
摘要:In designing a data warehouse (DW), there are several key decisions that have to be right for the DW to be a success. One of the most important of these decisions concerns the architecture of the DW. ...
阅读全文