事实表计数比事实表数据量大

 

事实表:

TweeterID,....。其中TweeterID为业务主键,没设置代理键。数据30万

维度表:

TweeterID,EducateName。EducateName为小学,中学,高中,大学这样的值。TweeterID唯一,即每个人只保留最高学历。数据量70万。

 

两表通过TweeterID做关联,一做模型,发现,悲剧了。

模型最终出来的事实表记录数为70万!

 

可以推测出,如果你的事实表用的是业务键,Cube在做处理的时候,处理方式不是left join,是外连接?会遍历中维度表中所有的记录!!!

 

没办法,本来想偷点懒的,最后还是只能把维度表改成EducateKey,EducateName这样的形式,在事实表中加EducateKey的字段。然后再做关联,就正确了。

 

posted on 2011-11-21 15:14  冰羽的世界  阅读(259)  评论(0编辑  收藏  举报