摘要: hadoop:分布式文件系统 spark:大规模数据处理的统一分析引擎。使用spark统计分析比上一代MapReduce快几倍 hive:基于hadoop的分布式数据库,以前是hadoop的一个子项目。Hive 的本质是将 SQL 语句转换为 MapReduce 或者 spark 等任务执行,并可以 阅读全文
posted @ 2020-11-12 13:34 JaminX86 阅读(462) 评论(0) 推荐(0) 编辑