摘要: 02 Spark架构与运行流程 1. 为什么要引入Yarn和Spark。 (1)现有的hadoop生态系统中存在的问题 1)使用mapreduce进行批量离线分析; 2)使用hive进行历史数据的分析; 3)使用hbase进行实时数据的查询; 4)使用storm进行实时的流处理; (2)选用spar 阅读全文
posted @ 2021-03-14 19:58 许健锐 阅读(54) 评论(1) 推荐(0) 编辑