摘要: 1. Spark是什么? Spark,是一种通用的大数据计算框架,正如传统大数据技术Hadoop的MapReduce、Hive引擎,以及Storm流式实时计算引擎等。 Spark包含了大数据领域常见的各种计算框架:比如Spark Core用于离线计算,Spark SQL用于交互式查询,Spark S 阅读全文
posted @ 2021-04-27 09:30 天午正阳 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 目录 一、 两者的各方面比较 二、Spark相对Hadoop的优越性 三、三大分布式计算系统 Spark,是分布式计算平台,是一个用scala语言编写的计算框架,基于内存的快速、通用、可扩展的大数据分析引擎 Hadoop,是分布式管理、存储、计算的生态系统;包括HDFS(存储)、MapReduce( 阅读全文
posted @ 2021-04-27 09:18 天午正阳 阅读(1161) 评论(0) 推荐(0) 编辑