会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
博客园
首页
私信博主
显示目录
隐藏目录
管理
动画
疯狂打码
博客园
首页
新随笔
联系
订阅
管理
2021年9月10日
HDFS(笔记二)
摘要: MapReduce:进行批处理(离线计算)基于磁盘。 Spark:基于内存(性能高一个层次)。 Hive:数据仓库,可以使用sql语句,Hive把sql语句转换成MapReduce作业,批量数据处理。 Pig:流数据处理,提供类似sql的查询语句PigLatin。 Oozie:作业流调度系统。 Zo
阅读全文
posted @ 2021-09-10 15:20 疯狂打码
阅读(129)
评论(0)
推荐(0)
编辑
公告