数据可视化之DAX篇(二十七)半累加度量,在Power BI 中轻松处理

https://zhuanlan.zhihu.com/p/96823622

​开始半累加的计算之前,我们先看看什么是累加、半累加以及不可累加数据。

在含有大量行的数据表中,各种数据处理语言,包括DAX,为了性能考虑,不太可能总是检索表的每一行,更常见的情形是,一次性检索成千上万行,处理如此多行数据的最有效操作就是将它们加到一起,也就是累加汇总。

可以累加的数据类型就是可累加数据,比如订单表中的销售额,就是这种类型,无论是按照客户维度还是按照时间维度,都可以将每行的销售额直接汇总,并且这种汇总的结果都是有效的、有意义的。

但有些数据是不可累加的,比如价格,虽然是数值,但无论如何累加都是没有意义的,这就是不可累加数据,这类数据最常用的操作是计数或者取平均值。

还有些数据在某些情况下可以累加,但在特定情况下不可累加,比如银行账户的资金余额,可以按照客户维度进行汇总,但并不能按照时间维度进行每日资金余额的汇总操作,每日余额的汇总是没有意义的,这样的数据类型就称为半累加数据。

在这三种类型中,最灵活最有用的当然是完全可累加数据,也是我们最常用的;而不可累加数据是最不灵活的,甚至可以当成是文本类型来看待。

居于其中的就是半累加数据,下面根据一个小例子来理解半累加度量,并看看如何在Power BI中进行它的计算。

假设每日库存余额的数据如下:

 

 

新建一个基础度量值:

库存 = SUM('库存表'[库存余额])

半累加度量的可累加属性

当计算每日的库存合计余额时,结果是这样的,

每日的库存余额合计,实际上是在商品维度上汇总,此时体现的是它在商品维度的可累加属性。

半累加度量的不可累加属性

如果上下文是月份,把这个[库存]度量值放进去,结果是这样的,

 

这个结果实际上是每日的库存余额简单相加,明显是无意义的数字,这时就体现了库存余额在时间维度的不可累加属性。

对于这个不可累加属性,库存更常见的计算是期末余额,实际上就是最后一天的余额,建个度量值如下:

期末库存余额 = CALCULATE([库存],LASTDATE('日期表'[日期]))

结果如下:

 

这样1月和2月的结果就正确了,但有个问题是3月份竟然返回了空值?

这是因为LASTDATE返回的当前月份的最后一天,如果每日的库存数据都很完整,这样没有问题,但实际情况是有些数据只显示工作日的库存,比如上面的例子,3月31日是周末,3月份库存余额记录的最后一天是3月29日。

因此需要计算最后一个有数据的日期的库存余额,修改度量值如下,

期末库存余额 优化= CALCULATE([库存],FILTER(ALL('日期表'),'日期表'[日期]=MAX('库存表'[日期])))

 

这样就计算出了正确的结果,

 

还有个更简单的写法是利用LASTNONBLANK函数,找到最后一个有余额的日期,然后再计算该日期的库存余额,

期末库存余额 优化2= CALCULATE([库存],LASTNONBLANK('日期表'[日期],[库存]))

 

 

上面DAX的计算原理,就是先找出最后一天的日期,然后在这个日期,计算所有商品的累计库存余额。

通过这个计算过程就能很清晰的理解半累加度量在时间维度上不可累加、在其他维度上可累加的属性。

半累加度量的计算应注意细节,因为是数值型,在任一维度上累加都不会报错,但某些结果很可能是无效的;不过当你清晰的认识到这个属性以后,利用灵活的DAX,顺畅的进行各种半累加度量的计算并不会成为问题。

posted @ 2020-05-03 11:39  秋华  阅读(1128)  评论(0编辑  收藏  举报