摘要: kylin&CDH理论基础 Kylin&CDH理论基础 一、维度与度量 维度是观察数据的角度。比如电商的销售数据,可以从时间维度来观察,进一步细化时间和地区维度来观察。 度量是被聚合的统计值,也是聚合运算的结果。知道维度和度量,可以对数据模型上的所有字段进行分类,要么维度,要么度量,由此就出现了根据维度、度量做预计算的Cube 阅读全文
posted @ 2023-12-16 15:11 戴莫先生Study平台 阅读(29) 评论(0) 推荐(0) 编辑
摘要: Altas&Ranger快速入门 Altas&Ranger快速入门 一、元数据 企业内部远行多种类型的数据库,有关系型数据库、非关系型数据库、图数据库、时序数据库等,常见有mysql、redis、Mongodb、oracle、prometheus等,数据库是用来管理和存储数据的,例如:oracle数据库:schema是一组数据库对象 阅读全文
posted @ 2023-12-16 15:09 戴莫先生Study平台 阅读(88) 评论(0) 推荐(0) 编辑
摘要: Hadoop快速入门 Hadoop快速入门 一、大数据思维 分而治之 所谓“分而治之”,就是把一个复杂的算法问题按一定的“分解”方法分为等价的规模较小的若干部分,然后逐个分别找出各部分的解,再把各部分的解组成整个问题的解。 传统的计算都是基于内存去完成的,但是内存是有限的,数据量太大,导致无法在较短时间内迅速解决,也就是 阅读全文
posted @ 2023-12-16 15:03 戴莫先生Study平台 阅读(97) 评论(0) 推荐(0) 编辑