摘要: 应该一般保证每个分区的数据的数目不大于两千万,大于两千万 数据就会访问比较慢 分区会一般根据时间进行分区,一般都需要保证每个分区的数量差不多,而比如对城市进行分区,那么可能信息并不相同,进而导致每个分区的数量不同。 设计度量值的时候可以有很多选项,比如说就MAX的值或者其他的,就是为了以后聚合使用的,后面设计聚合的时候 一般会对城市或者时间设计百分之百的聚合,为了提高查询的效... 阅读全文
posted @ 2012-02-13 14:57 honkcal 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 星形架构每个纬度表利用纬度关键字通过事实表中的外键约束于事实表中的某一行,实现与事实表的关联,这就要求事实表中的外键不能为空,这与一般数据库中外键允许为空是不同的。这种结构就使得用户能够很容易的从纬度表中的数据分析开始,获得纬度的关键字,以便连接到中心的事实表,进行查询,这样就减少了在事实表中扫描的数据量,以提高查询性能。雪花型架构纬度表除了具有星形模式中的纬度表的功能之外,还连接对事实表进行详细描述的详细类别表,详细类别表通过对事实表在有关纬度上的详细描述达到了缩小事实表和提高查询的目的。数据仓库数据集市数据集市就是面向不同主题的,一个主题对应自己的一个表,他和数据仓库的不同实际上就是数据仓 阅读全文
posted @ 2012-02-13 14:08 honkcal 阅读(2377) 评论(0) 推荐(0) 编辑