摘要:种类:输入id:AvroInput描述:该功能还在开发中。 http://wiki.pentaho.com/display/EAI/Avro+Input 阅读全文
Junk dimensions
2013-05-25 21:19 by 很大很老实, 266 阅读, 0 推荐, 收藏, 编辑
摘要:今天学习仓库,了解到有这么一类维度定义:Junk dimensions。于是查找一些资料,根据这个资料学习了一把。http://www.kimballgroup.com/2009/06/03/design-tip-113-creating-using-and-maintaining-junk-dimensions/ 阅读全文
Expert Cube Development with Microsoft SQL Server 2008 Analysis Services(3) 第一章
2013-05-25 20:40 by 很大很老实, 235 阅读, 0 推荐, 收藏, 编辑
摘要:第一章:设计一个用来提供分析服务的数据仓库本章主要是介绍,如何设计一个用来提供分析服务的数据仓库。有无数本书,介绍过数据仓库理论,维度建模等。本书不讨论这些。本章主要是介绍数据仓库设计的各个方面,有些主题,诸如:Analysis Services cube and dimension design,将在后续章节仔细介绍,有些主题,在本书之外,就不多介绍。1.源数据库a)The OLTP 数据库 一般情况下,在客户需要根据自己的数据进行分析,展示和报表生成时,一个bi解决方案就出现了。这些数据可能以成千上万行,甚至是几百万行的量 存在数据库里,供业务使用。这类数据库,就是oltp。可能是cr.. 阅读全文
PDI的steps:(8:Automatic Documentation Output)
2013-05-25 18:53 by 很大很老实, 248 阅读, 0 推荐, 收藏, 编辑
摘要:分类:Outputid:AutoDoc描述:这个step,是为一个或者多个转换或者job提供描述性的文档。这个step呢,可以作为一种手段,自动化的产生文档,用来描述转换或者job的目标;或者用来供大家掌握转换或者job的变化。产生的文档,如下:这里需要注意的是:只支持:Only types 'Transformation' and 'Job' are supported。因此,需要用值映射,对文件扩展名进行转换。 阅读全文
PDI的steps:(7:Append streams)
2013-05-25 18:11 by 很大很老实, 199 阅读, 0 推荐, 收藏, 编辑
摘要:种类:flowid:append描述:这个step,从2个step读取数据,不过,只处理第二个step的数据(在第一个step完成以后)。 一般情况下,这2个step的数据行的格式是一模一样的:相同的长度,相同的字段类型,相同的索引等。Important: If you don't care about the order in which the output rows occur, you can use any step to create a union of 2 or more data streams.OptionsOptionDescriptionStep nameNam 阅读全文
Expert Cube Development with Microsoft SQL Server 2008 Analysis Services(1)
2013-05-24 15:40 by 很大很老实, 269 阅读, 0 推荐, 收藏, 编辑
摘要:本书构建在sql 2008基础上。本书主要包括以下内容:第一章,展示如何建立一个数据集市,作为分析服务的数据源。第二章,介绍如何在bi开发环境里简单的建立维库和cube,就是:dimensions and cubes.第三章:discusses more complex dimension design problems such as slowly changing dimensions and ragged hierarchies. slowly changing dimensions:渐变维度;见:http://msdn.microsoft.com/zh-cn/library/ms141 阅读全文
Expert Cube Development with Microsoft SQL Server 2008 Analysis Services(2)度量值和度量值组
2013-05-24 15:19 by 很大很老实, 631 阅读, 0 推荐, 收藏, 编辑
摘要:度量值表示包含可以聚合的可计量数据(通常是数值)的列。度量值通常映射到事实数据表中的列。还可以使用“度量值表达式”,基于由多维表达式修改的事实数据表中的列来定义度量值。度量值表达式支持对度量值的值设置权重;例如,可以用货币换算按汇率来设置销售额度量值的权重。维度表中的属性列可以用于定义度量值,但是这些度量值通常在聚合行为方面具有半累加性或非累加性。有关半累加性行为的详细信息,请参阅定义半累加性行为。还可以使用多维表达式 (MDX) 将度量值定义为“计算成员”,从而为基于多维数据集中其他度量值的度量值提供计算值。计算成员会增加 Analysis Services 中多维数据集的灵活性,并提高其分 阅读全文
PDI的steps:(6:Analytic Query)
2013-05-24 13:48 by 很大很老实, 371 阅读, 0 推荐, 收藏, 编辑
摘要:DescriptionThis step allows you to peek forward and backwards across rows. Examples of common use cases are:Calculate the "time between orders" by ordering rows by order date, and LAGing 1 row back to get previous order time.Calculate the "duration" of a web page view by LEADing 阅读全文
PDI的steps:(5:Add XML)
2013-05-24 12:47 by 很大很老实, 262 阅读, 0 推荐, 收藏, 编辑
摘要:种类:转换;id:AddXML描述:Encode several fields into an XML fragmentThe XML column step allows you to encode the content of a number of fields in a row in XML. This XML is added to the row in the form of a String field.这个step,允许你把一行里的几个字段组合成一个xml格式的内容,并作为一个string字段存储到列里。在这里编辑字段。Content TabOptionDescriptionS 阅读全文
PDI的steps:(5:Add value fields changing sequence)
2013-05-23 22:14 by 很大很老实, 357 阅读, 0 推荐, 收藏, 编辑
摘要:种类:转换;id:FieldsChangeSequence。描述:Add sequence depending of fields value change. Each time value of at least one field change, PDI will reset sequence.。 阅读全文