BI开发之——Mdx基础语法(1)

 

Mdx为MultiDimensional  Expressions的缩写,多维表达式,是标准的OLAP查询语言。在多数OLAPServer都提供Mdx支持,如Microsoft Sql Server OLAP Services,SAS,Hyperion Essbase等。支持多维对象于数据定义和操作。Mdx很多方面与结构化查询语言(SQL)语法相似,但他不是SQL语言的扩展;事实上,Mdx所提供的一些功能也可由SQL提供,尽管不是那么有效或直观。

  如同SQL查询一样,每个Mdx查询都要求有数据请求(select子句)、起始点(From子句)和筛选(where子句)。这些关键字以及其它关键字提供了各种工具,用来从多维数据集析取数据的特定部分。Mdx还提供了可靠的函数集,用来检索的数据进行操作,同时还具有用户定义函数扩展Mdx的能力。

Mdx为多维数据库提供了表达式语查询语法,用于cube数据,并提供了许多强大的分析函数,用于支持常用的OLAP分析。

语法

 维度、级别、成员等,一般用唯一名称UniqueName来标示,可以用[]包围name,如果name有空格或者数字开头,必须使用[],否则可以忽略。UniqueName是根据层次结构表示的一种方法。即递归显示出祖先的名称。

维度(Dimension):维度直接用[]包围。比如Product的唯一名称为[Product]或Product。

级别(Level):级别的UniqueName为[维度名称].[级别名称],如[year].[2001],同样,如果没有空格,[]可以省略,如year.[2001]。

成员(Member):成员的UniqueName格式为[维度].(Parent  Member  UniqueName).[Member Name],如:时间维上的2003年2月份的UniqueName为[2003].[1].[2],中间的1为1季度,因为该维度的结构为年、季、月。

度量(Measure):度量实际上市属于维度维的成员,也就是说度量(Measure)是任何Cube的一个维度。如:度量Unit Sales的UnqiueName为[Measures].[Unit Sales]

 UniqueName是OLAP元素内部的表示法,在Mdx查询语言中,可以使用UniqueName来表示元素。

Mdx还提供模糊和其他等价的元素的表示方式:

<1>省略维度名表示级别,如果一个维度的级别名在整个Cube中是唯一的,那么可以省略维度名来查询级别。如Product.[Product Family]可以写成[Product Family]

<2>省略维度名称表示成员。如果省略维度名,可以标示该维度最高级别的成员,如[Time].[2000]可以写成[2000],[Measures].[Unit Sales]可以写成[Unit Sales]。

<3>成员挂在级别下,即成员不一定要写成[维度].(Parent  Member  UniqueName).[Member Name],可以写成[维度].[级别].[Member Name],如2000年3月可以写成[Time].[Months].[3]

模糊查询表示法,都基于不会重复的假设,如果有重复的元素,取第一个查找的元素作为查询结果,可能发生错误,因此,建议使用完备的表示法

 元组、集合

  元组用于定义来自多维数据切片;他是由一个或多个维度的单个成员的有序集合组成。元组内不包含来自同一个维度的多个成员(可以理解为坐标),元组用()包围。

如:

(时间.[下半年])

(时间.[下半年],[产品].[手机].[Nokia])

如果一个元组是由单个维度的成员组成,那么可以不用()包围,即(时间.[下半年])可表示为:时间.[下半年]

集合(Set)是零个、一个或多个元组的有序集合。集合最常用于在Mdx查询中定义轴维度和切片器维度,并且同样可能只具有单个元组或可能在某些情况下为空。在Mdx语法中,元组用花括号{}来构造集合

举例,下面是具有两个元组的集合:

{(时间.[上半年],路线.非陆地.航空),(时间.[下半年],路线.非陆地.海路)}

一个集合可包含同一个元组不止一次的出现。这样也是可以的:

{时间.[下半年],时间.[下半年]}

集合值以元组表示的一组成员组合,或指集合中的元组所代表的单元中的值,视集合使用的上下文而定。

注意:单个元组的集合不等于元组。如{时间.[下半年]}不等于  时间.[下半年]。

在Mdx语法中,很多函数语义中包含元组和集合,作为参数或者返回值。

Mdx基本语法结构

  先看看Mdx基本语法结构:

   SELECT  [axis specification] ON COLUMNS,

                [axis specification] ON ROWS

   FROM

                [cube name]

   WHERE

              [silcer specification]

1、[axis specification]可以看成是轴的成员选择。

2、[silcer specification]表示切片上的成员,可以看成过滤信息,[silcer specification]可选,如果没有指定,取系统默认的维度成员作为切片

 

轴维度和切片器维度

当设计多维表达式(Mdx)查询时,应用程序一般查看多维数据集并将维度集合划分为两个子集:

1、轴维度,为多个成员检索数据的维度

2、切片器维度,为单个成员检索数据的维度。

因为轴维度和切片器维度都从要查询的多维数据集的多个维度构造,所以用这些术语将要查询的多维数据集使用的维度与在由Mdx查询返回的多维数据集中创建的维度区分开。

例如:

假定存在名为TestCube的多维数据集,具有两个名为Route和Time的简单维度。因为多维数据集的度量值是Measures维度的一部分,所以该多维数据集总共有三个维度。查询要提供一个矩阵,可以在该矩阵内跨路线和时间比较Packages度量值

在下面的Mdx查询实例中,Route和Time维度用作轴维度,Measures维度用作切片器维度。Members函数表明要用于构造集合的维度或级别的成员,而不必再Mdx查询中显示声明给定维度或级别的各个成员。

SELECT

  {Route.nonground.Members} ON COLUMNS

  {Time.[1st half].Members} ON ROWS

FROM

  TestCube

WHERE  ([Mesures].[Packages])

指定维度的内容:

轴维度决定多维结果结果集的边缘。多维表达式(Mdx)使用Select子句通过将集合指派到特定轴来指定轴维度。

在下面的语法示例中,每个<axis_specification>值定义一个轴维度。数据集中轴的个数等于多维表达式(Mdx)查询中<axis_specification>值的个数。Mdx查询最多可以支持128个指定轴,但几乎没有Mdx查询会用到5个以上的轴。

<axis_specification>语法可分解为:

<axis_specification>::=<set> ON <axis_name>

<axis_name>::=COLUMNS|ROWS

轴维度上的只能接受集合<set>,如果是手动指定成员集合,必须用{}包围,如果使用Mdx集合函数,则不需要用{}包围,因为集合函数返回值为集合。一个轴维度上可以包含几个维度,如:

SELECT

     {

          [Measures].[Sales_Dollars], [Measures].[Sales_Units],

          [Measures].[Sales_Units_max]

     }

ON

   columns,

     CrossJoin(

                      {

                             [State].[Canada], [State].[Mexico], [State].[USA]

                      },

                     {

                              [Product].[Bread], [Product].[Dairy], [Product].[Meat]

                      }

               ) ON rows

 FROM

     sales

 WHERE

      ([Time].[All Time], [Employee].[All Employee])

 Columns轴上是手工指定成员元组集合,用{}包围,Rows轴使用集合函数CrossJoin,该函数返回两个集合的交集,Rows轴上包含两个维度State和Product。

指定切片器维度的内容

切片器维度筛选器多维数据,可以通过将切片器维度包含在多维表达式(Mdx)查询的Where子句来限制所返回的数据。

假定未显示指派给轴的维度是切片器维度,并用其默认成员进行筛选。则默认成员为最高级别的的第一个成员。

切片器维度还可通过Mdx语法的Where子句进行显示指定。Where子句的语法可分解为:

[WHERE  [<silcer_specification>]]

切片器维度只可接受评估为单个元组的表示式。如下例所示:

WHERE  ([Time].[1st half],[Route].[nonground]) 

 

posted @ 2012-02-16 22:57  指尖流淌  阅读(20934)  评论(0编辑  收藏  举报