博客园 首页 私信博主 显示目录 隐藏目录 管理 动画
摘要: MapReduce:进行批处理(离线计算)基于磁盘。 Spark:基于内存(性能高一个层次)。 Hive:数据仓库,可以使用sql语句,Hive把sql语句转换成MapReduce作业,批量数据处理。 Pig:流数据处理,提供类似sql的查询语句PigLatin。 Oozie:作业流调度系统。 Zo 阅读全文
posted @ 2021-09-10 15:20 疯狂打码 阅读(129) 评论(0) 推荐(0) 编辑