Less is more.|

大背头

园龄:4年8个月粉丝:5关注:4

04 2023 档案

自建基于Hadoop+Hive+Spark的离线数仓总结
摘要:写在前面 1. 什么是离线数仓,为什么做离线数仓?为什么mysql不能作为数仓的存储? 首先我们要知道我们想做什么,我们的目的不是做业务系统的OLTP工作。而是要对海量的数据做OLAP操作。海量数据的分布式存储mysql也许可以满足,但分布式计算,mysql便无法胜任。而hadoop的hdfs与mr
680
0
0
点击右上角即可分享
微信分享提示
深色
回顶
收起