会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大背头
博客园
首页
新随笔
联系
订阅
管理
2023年4月7日
自建基于Hadoop+Hive+Spark的离线数仓总结
摘要: 写在前面 1. 什么是离线数仓,为什么做离线数仓?为什么mysql不能作为数仓的存储? 首先我们要知道我们想做什么,我们的目的不是做业务系统的OLTP工作。而是要对海量的数据做OLAP操作。海量数据的分布式存储mysql也许可以满足,但分布式计算,mysql便无法胜任。而hadoop的hdfs与mr
阅读全文
posted @ 2023-04-07 09:31 大背头
阅读(505)
评论(0)
推荐(0)
编辑
公告