BI开发之——Mdx基础语法(1)
Mdx为MultiDimensional Expressions的缩写,多维表达式,是标准的OLAP查询语言。在多数OLAPServer都提供Mdx支持,如Microsoft Sql Server OLAP Services,SAS,Hyperion Essbase等。支持多维对象于数据定义和操作。Mdx很多方面与结构化查询语言(SQL)语法相似,但他不是SQL语言的扩展;事实上,Mdx所提供的一些功能也可由SQL提供,尽管不是那么有效或直观。
如同SQL查询一样,每个Mdx查询都要求有数据请求(select子句)、起始点(From子句)和筛选(where子句)。这些关键字以及其它关键字提供了各种工具,用来从多维数据集析取数据的特定部分。Mdx还提供了可靠的函数集,用来检索的数据进行操作,同时还具有用户定义函数扩展Mdx的能力。
Mdx为多维数据库提供了表达式语查询语法,用于cube数据,并提供了许多强大的分析函数,用于支持常用的OLAP分析。
语法
维度、级别、成员等,一般用唯一名称UniqueName来标示,可以用[]包围name,如果name有空格或者数字开头,必须使用[],否则可以忽略。UniqueName是根据层次结构表示的一种方法。即递归显示出祖先的名称。
维度(Dimension):维度直接用[]包围。比如Product的唯一名称为[Product]或Product。
级别(Level):级别的UniqueName为[维度名称].[级别名称],如[year].[2001],同样,如果没有空格,[]可以省略,如year.[2001]。
成员(Member):成员的UniqueName格式为[维度].(Parent Member UniqueName).[Member Name],如:时间维上的2003年2月份的UniqueName为[2003].[1].[2],中间的1为1季度,因为该维度的结构为年、季、月。
度量(Measure):度量实际上市属于维度维的成员,也就是说度量(Measure)是任何Cube的一个维度。如:度量Unit Sales的UnqiueName为[Measures].[Unit Sales]
UniqueName是OLAP元素内部的表示法,在Mdx查询语言中,可以使用UniqueName来表示元素。
Mdx还提供模糊和其他等价的元素的表示方式:
<1>省略维度名表示级别,如果一个维度的级别名在整个Cube中是唯一的,那么可以省略维度名来查询级别。如Product.[Product Family]可以写成[Product Family]
<2>省略维度名称表示成员。如果省略维度名,可以标示该维度最高级别的成员,如[Time].[2000]可以写成[2000],[Measures].[Unit Sales]可以写成[Unit Sales]。
<3>成员挂在级别下,即成员不一定要写成[维度].(Parent Member UniqueName).[Member Name],可以写成[维度].[级别].[Member Name],如2000年3月可以写成[Time].[Months].[3]
模糊查询表示法,都基于不会重复的假设,如果有重复的元素,取第一个查找的元素作为查询结果,可能发生错误,因此,建议使用完备的表示法
元组、集合
元组用于定义来自多维数据切片;他是由一个或多个维度的单个成员的有序集合组成。元组内不包含来自同一个维度的多个成员(可以理解为坐标),元组用()包围。
如:
(时间.[下半年])
(时间.[下半年],[产品].[手机].[Nokia])
如果一个元组是由单个维度的成员组成,那么可以不用()包围,即(时间.[下半年])可表示为:时间.[下半年]
集合(Set)是零个、一个或多个元组的有序集合。集合最常用于在Mdx查询中定义轴维度和切片器维度,并且同样可能只具有单个元组或可能在某些情况下为空。在Mdx语法中,元组用花括号{}来构造集合
举例,下面是具有两个元组的集合:
{(时间.[上半年],路线.非陆地.航空),(时间.[下半年],路线.非陆地.海路)}
一个集合可包含同一个元组不止一次的出现。这样也是可以的:
{时间.[下半年],时间.[下半年]}
集合值以元组表示的一组成员组合,或指集合中的元组所代表的单元中的值,视集合使用的上下文而定。
注意:单个元组的集合不等于元组。如{时间.[下半年]}不等于 时间.[下半年]。
在Mdx语法中,很多函数语义中包含元组和集合,作为参数或者返回值。
Mdx基本语法结构
先看看Mdx基本语法结构:
SELECT [axis specification] ON COLUMNS,
[axis specification] ON ROWS
FROM
[cube name]
WHERE
[silcer specification]
1、[axis specification]可以看成是轴的成员选择。
2、[silcer specification]表示切片上的成员,可以看成过滤信息,[silcer specification]可选,如果没有指定,取系统默认的维度成员作为切片
轴维度和切片器维度
当设计多维表达式(Mdx)查询时,应用程序一般查看多维数据集并将维度集合划分为两个子集:
1、轴维度,为多个成员检索数据的维度
2、切片器维度,为单个成员检索数据的维度。
因为轴维度和切片器维度都从要查询的多维数据集的多个维度构造,所以用这些术语将要查询的多维数据集使用的维度与在由Mdx查询返回的多维数据集中创建的维度区分开。
例如:
假定存在名为TestCube的多维数据集,具有两个名为Route和Time的简单维度。因为多维数据集的度量值是Measures维度的一部分,所以该多维数据集总共有三个维度。查询要提供一个矩阵,可以在该矩阵内跨路线和时间比较Packages度量值
在下面的Mdx查询实例中,Route和Time维度用作轴维度,Measures维度用作切片器维度。Members函数表明要用于构造集合的维度或级别的成员,而不必再Mdx查询中显示声明给定维度或级别的各个成员。
SELECT
{Route.nonground.Members} ON COLUMNS
{Time.[1st half].Members} ON ROWS
FROM
TestCube
WHERE ([Mesures].[Packages])
指定维度的内容:
轴维度决定多维结果结果集的边缘。多维表达式(Mdx)使用Select子句通过将集合指派到特定轴来指定轴维度。
在下面的语法示例中,每个<axis_specification>值定义一个轴维度。数据集中轴的个数等于多维表达式(Mdx)查询中<axis_specification>值的个数。Mdx查询最多可以支持128个指定轴,但几乎没有Mdx查询会用到5个以上的轴。
<axis_specification>语法可分解为:
<axis_specification>::=<set> ON <axis_name>
<axis_name>::=COLUMNS|ROWS
轴维度上的只能接受集合<set>,如果是手动指定成员集合,必须用{}包围,如果使用Mdx集合函数,则不需要用{}包围,因为集合函数返回值为集合。一个轴维度上可以包含几个维度,如:
SELECT
{
[Measures].[Sales_Dollars], [Measures].[Sales_Units],
[Measures].[Sales_Units_max]
}
ON
columns,
CrossJoin(
{
[State].[Canada], [State].[Mexico], [State].[USA]
},
{
[Product].[Bread], [Product].[Dairy], [Product].[Meat]
}
) ON rows
FROM
sales
WHERE
([Time].[All Time], [Employee].[All Employee])
Columns轴上是手工指定成员元组集合,用{}包围,Rows轴使用集合函数CrossJoin,该函数返回两个集合的交集,Rows轴上包含两个维度State和Product。
指定切片器维度的内容
切片器维度筛选器多维数据,可以通过将切片器维度包含在多维表达式(Mdx)查询的Where子句来限制所返回的数据。
假定未显示指派给轴的维度是切片器维度,并用其默认成员进行筛选。则默认成员为最高级别的的第一个成员。
切片器维度还可通过Mdx语法的Where子句进行显示指定。Where子句的语法可分解为:
[WHERE [<silcer_specification>]]
切片器维度只可接受评估为单个元组的表示式。如下例所示:
WHERE ([Time].[1st half],[Route].[nonground])