10 2014 档案
摘要:该系统属于数据仓库系统,与传统的管理信息系统有本质差别,是“面向主题”设计的。“面向主题”的方式,既有利于数据组织和利用,又有利于用户的理解和使用。分析主题主要维度:烟叶级别、烟叶级别按等级信息、烟叶级别按分级标准(标准维度) 产地(父子维度) 检测时间(时间维度,以Tqc_Raw_Chemistr...
阅读全文
摘要:导入列:导入列例子现在来做一个例子:创建路径D:\Pictures随便在路径D:\Pictures中粘贴4个比较小的图像文件命名为01.png、02.png、03.png、04.png在路径D:\Pictures内创建一个txt文件命名为filelist.txt,文件内容如下D:\Pictures\...
阅读全文
摘要:建立测试数据:CREATE TABLE FactResults ( Name VARCHAR(50) , Course VARCHAR(50) , Score INT )INSERT INTO FactResults ( Name , ...
阅读全文
摘要:关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理。为数据仓库的发展和使用提供方便。关于数据的数据,用于构造、维持、管理、和使用数据仓库,在数据仓库中尤为重要。不同 O...
阅读全文
摘要:字词查找转换将从转换输入列的文本中提取的字词与引用表中的字词进行匹配,然后计算出查找表中的字词在输入数据集中出现的次数,并将计数与引用表中的此字词一并写入转换输出的列中。此转换对于创建基于输入文本并带有词频统计信息的自定义词列表很有用。本章功能:取出一个表中某字段的数据,并取出另一个表中的关键词,判...
阅读全文
摘要:逆透视转换将来自单个记录中多个列的值扩展为单个列中具有同样值的多个记录,使得非规范的数据集成为较规范的版本。例如,每个客户在列出客户名的数据集中各占一行,在该行的各列中显示购买的产品和数量。逆透视转换将数据集规范之后,客户购买的每种产品在该数据集中各占一行。 我们下一步是进行逆透视。与透视配置...
阅读全文
摘要:这个和T-SQL中的PIVOT和UNPIVOT的作用是一样的。数据透视转换可以将数据规范或使它在报表中更具可读性。通过透视列值的输入数据,透视转换将规范的数据集转变成规范程度稍低、但更为简洁的版本。例如,在列有客户名称、产品和购买数量的规范的 Orders 数据集中,任何购买多种产品的客户都有多行,...
阅读全文
摘要:什么是数据挖掘?数据挖掘(Data Mining),又称信息发掘(Knowledge Discovery),是用自动或半自动化的方法在数据中找到潜在的,有价值的信息和规则。数据挖掘技术来源于数据库,统计和人工智能。数据挖掘能够做什么对企业中产生的大量的数据进行分析,找出其中潜藏的规则更加清晰的了解目...
阅读全文
摘要:Microsoft SQL Server是一个提供了联机事务处理、数据仓库、电子商务应用的数据库和数据分析的平台。体系架构是描述系统组成要素和要素之间关系的方式。Microsoft SQL Server系统的体系结构是对Microsoft SQL Server的主要组成部分和这些组成部分之间关系的描...
阅读全文
摘要:百分比抽样和行抽样可以从数据源中随机选择一组数据。这两种task都可以产生两组输出,一组是随机选择的,另一组是没有被选择的。可以将这些选择出的数据发送到开发或者测试服务器上。这个Task的最合适的应用是建立数据挖掘模型然后,使用这些抽样数据来验证这个模型。编辑这种task,选择要抽取的行数或者 百分...
阅读全文
摘要:根据条件分割数据是一个在数据流中添加复杂逻辑的方法,它允许根据条件将数据输出到其他不同的路径中。例如,可以将TotalSugar= 27.4406的输出到另一个路径。如图。可以从上面的属性结构中拖放一个列或者代码段,然后根据逻辑重命名而不是使用默认值Case1,还可以编辑输出列的名字。
阅读全文
摘要:派生列转换通过对转换输入列应用表达式来创建新列值。 表达式可以包含来自转换输入的变量、函数、运算符和列的任意组合。 结果可作为新列添加,也可作为替换值插入到现有列。 派生列转换可定义多个派生列,任何变量或输入列都可以出现在多个表达式中。可以使用此转换执行下列任务:将不同列的数据连接到一个派生列中。 ...
阅读全文
摘要:排序转换允许对数据流中的数据按照某一列进行排序。这是五个常用的转换之一。连接数据源打开编辑界面,编辑这种任务。不想设置为排序列的字段不要选中,默认情况下所有列都会选中。如图所示,按照TotalSugar_Cnt排序,并将所有列输出。在底部的表格中,可以设置输出列的别名,是否按照列来排序。Sort O...
阅读全文
摘要:数据转换执行类似于T-SQL中的函数CONVERT或CAST的功能。数据转换的编辑界面如图,选择需要转换的列,在DataType下拉列表中选择需要的数据类型。Output Alias栏内设置输出时使用的别名。
阅读全文
摘要:特征映射转换如图展示数据流中列的特征,它的编辑界面很简单,只有一个标签界面,点击要进行映射的列,可以选择需要添加新列或需要更新的列。可以在Output Alias列中给原来的列一个别名,选择要进行的操作,可以进行的操作类型有:Byte Reversal:逆转数字位的顺序,例如数据0x1234 0x9...
阅读全文
摘要:审核转换允许对数据流添加审核审核数据,以往使用HIPPA和Sarbanes-Oxley (SOX)时,必须跟踪谁在什么时插入数据,审核转换可以实现这种功能。例如要跟踪那一个task向表里插入数据,可以在审核转换中添加相应的列。在Output Column Name列中输入想要审核的列,在Audit ...
阅读全文
摘要:聚合转换可以像T-SQL中的函数GROUP BY, Average, Minimum, Maximum, 和 Count一样对数据进行聚合运算。在图中可以看到数据以SampleID分组,对TotalSugar做Average、Maximum、Minimum、Count操作。这样产生了4列新的数据,供...
阅读全文
摘要:数据仓库建模 — 星型模式Example of Star Schema数据仓库建模 — 雪片模式Example of Snowflake Schema节省存储空间一定程度上的范式星形 vs.雪花型Which one is better?长期以来的争论两种观点各有支持者争论在继续……目前看来,大部分更...
阅读全文
摘要:关系 OLAP (ROLAP)ROLAP的基本数据和聚合数据均存放在关系数据库中;ROLAP 存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。但是,可为分区数据使用 ROLAP 存储模式,而不在关系数据库中创建聚合。使用 ROLAP 的维度的数据实际上存储在用于定义维度的表中。相...
阅读全文
摘要:原创·《BI那点儿事—数据的艺术》教程免费发布 各位园友,大家好,我是Bobby,在学习BI和开发的项目的过程中有一些感悟和想法,整理和编写了一些学习资料,本来只是内部学习使用,但为了方便更多的BI开发者,推动BI企业级应用开发,决定整理成一部教程,并在网络上免费发布该教程,希望为BI时代贡献绵薄之...
阅读全文
摘要:本节建立:历年的初烟水分均值变化分析Cube:区域维度:地州,专县时间维度:年等级维度:大等级,小等级指标:水分均值数据源视图:数据处理:ALTER TABLE T_QualMoisture_Middle ALTER COLUMN V_Produce_ID VARCHAR(50) ALTER TAB...
阅读全文
摘要:增量抽取 增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据。在ETL使用过程中。增量抽取较全量抽取应用更广。如何捕获变化的数据是增量抽取的关键。对捕获方法一般有两点要求:准确性,能够将业务系统中的变化数据按一定的频率准确地捕获到;性能,不能对业务系统造成太大的压力,影响现有业务。目前...
阅读全文
摘要:用Excel2013连接和浏览OLAP多维数据集
阅读全文
摘要:Microsoft SQL Server Analysis Services 提供了几种函数,用来针对包含在度量值组中的维度聚合度量值。默认情况下,度量值按每个维度进行求和。但是,通过 AggregateFunction 属性,您可以修改此行为。聚合函数的累加性可确定度量值如何在多维数据集的所有维度...
阅读全文
摘要:本系列文章主要是结合实际项目,加上自己的总结,整理出来的一系列项目笔记,涉及微软SQL Server2008中商务智能开发中的SSAS、SSIS模块:准备工作:《BI项目笔记》基于雪花模型的维度设计《BI项目笔记》数据源视图设置《BI项目笔记》创建标准维度、维度自定义层次结构《BI项目笔记》创建父子...
阅读全文
摘要:有两个事实表,因此就有两个度量值组,并且向导将为非维度键的事实表中的每一个数值列创建一个度量值。由于我们这里不需要那么多,所以只选择部分度量值。另外要注意,度量值的名称源于事实表中的列,所有名称由可能相同。但是在多维数据集中,由于度量值的名称必须是唯一的,所以向导会在重复的度量值名称后添加所属的度量...
阅读全文
摘要:创建步骤:而ParentOriginID其实就是对应的ParentOriginID,它的 Usage 必须是 Parent 才能表示这样的一个父子维度。查看OriginID属性, Usage 是 Key。 在这里一定要注意,父子关系层次结构中的子级必须是维度的关键属性,所以OriginID这里的 U...
阅读全文
摘要:创建步骤:序号选择的属性重命名后的名称属性类别1DateKeyDateKey常规2Month KeyMonth Key月份3English Month NameEnglish Month Name每年的某一月4Month Number Of YearMonth Number Of Year常规5Ca...
阅读全文
摘要:目的数据源视图是物理源数据库和分析维度与多维数据集之间的逻辑数据模型。在创建数据源视图时,需要在源数据库中指定包含创建维度和多维数据集所需要的数据表格和视图。BIDS与数据库连接,读取表格和视图定义,并在数据源视图中存储元数据。元数据是“关于数据的数据”:即表格和视图的名称、列名称、数据类型、主键列...
阅读全文
摘要:SSAS Date 维度基本上在所有的 Cube 设计过程中都存在,很难见到没有时间维度的 OLAP 数据库。但是根据不同的项目需求, Date 维度的设计可能不大相同,所以在设计时间维度的时候需要搞清楚几个问题:你的业务涉及到的最低的细节级别是什么?比如按季度查看报表还是按月份,或者按周,或者再甚...
阅读全文
摘要:GBGradeCode外键关系:1烟叶等级T_GBGradeCode.I_DistinctionID=T_Distinction.I_DistinctionID烟叶等级分为:上等烟、中等烟、下等烟、末等烟、低等烟、低次等烟、其它、下低等烟2分级标准T_GBGradeCode.I_GradStanCo...
阅读全文