《分析服务从入门到精通读书笔记》第一章、数据分析层次结构(2)

目的

通过简单的层次结构将产品和模型属性进行组织,并使用层次结构对详细数据分组和汇总的报表。本节了解如何建立层次架构

内容

通过第一节中的介绍,相关属性添加到各个级别,可以创建层次结构。基于“模型”层次结构的产品只有两级,但其实层次结构可以有很多个级别。例如、通过将月份属性作为最底层,同时添加由季度和年度属性组成的中间级(intermediate level),可以创建包含多个级的日期层次结构。我们可以在日期层次架构中添加添加顶层添加新的一级,称为All级。All级只包含一个成员——所有日期——所有成员年度的聚合。

图1.1 日期层次结构

图1.1说明了按照“所有日期”、“年”、“季度”、“月份”排列的日期层次结构中的部分节点。

我们可以将层次结构中的成员视作为父子关系。一个级中的成员是下一级相关成员的父级,同时上一级相关成员的子级,如上图中,2011是2011年第1季度和2011年第2季度的父级,2011年2月是2011年第1季度的子级。日期层次结构是一个自然层次结构。在自然层次结构中,每一个子成员只有一个父成员,前文中的颜色尺寸层次结构就不是一个自然层次结构。尺寸级的成员40有两个父级:颜色级中的黑色和银色。

图1.1也说明了一个层次结构可以有多个分支。树枝的末端是树叶,同样,层次结构分支的末端也是叶成员。一个层次结构可以有All(全部)成员,也可以没有,但必须要有叶成员。

我们可以将每一个属性变成只有两个级的属性层次结构,即将原属性作为叶级,同时增加一个All级,例如,可以创建包括All级成员“全部产品”和叶级成员“黑色”和“银色”的颜色层次结构。

有些层次结构是对称(balanced)的,例如日期层次结构,如图1.1,无论顺着分支的哪条路径,总能在每级中找到一个成员,每条路径也具有相同数目的级。在对称的层次结构中,给各级命名很容易。

有些层次结构是不对称(unbalanced)的,组织结构图通常是不对称的。例如,在许多公司,制造部分的雇员比人力资源部门的雇员要多很多,因此,需要更多的管理级。工作分解结构图和财务表也是不对称层次结构的例子,在不对称的层次结构中,很难给特定的级命名,而叶成员通常是那些没有子成员。

图1.2 组织机构图

如图1.2所示的不对称层次结构,无论顺着哪一条分支,总能在每一级找到一个成员。然后有的路径可能有更多的级,换句话说,叶成员可能属于不同的级。

有的层次结构很难区分是对称的还不是不对称的。例如,在地理层次结构中,可以很容易地对级命名:All级、国家级、州/省级、市级,然后,有的国家可能没有州或省。这就是不规则层次(ragged hierarchy)。

图1.3 不规则层次结构

无论沿着那一条路径,每条路径都具有相同数目的级,然后,有的路径并不一定在每级上都有成员。在不规则层次结构中,也成员通常属于同一级。

层次结构是将相关组织成级而形成的,层次结构可以少至数级。层次结构有一个最低的级,叫做叶级,其上是若干的中间级,最后是顶级。在大多数的层次结构中,顶级是All级并只包含单个All成员。可以将层次结构中的成员比作父子关系,如果子成员只有一个父成员。则该层次结构为自然层次结构。如果是一个对称层次结构,那么层次结构中的每条路径都有相同数目的级并且每级都有一个成员。在不对称层次结构中,不同的路径会有不同数据的级。在不规则层次结构中,每条路径有相同数目的级,但并非所有级都有成员。

posted @ 2012-02-29 15:17  指尖流淌  阅读(1190)  评论(0编辑  收藏  举报