摘要: Apache Spark是一种快速、通用、可扩展、可容错的、基于内存迭代计算的大数据分析引擎。首先强调一点, Spark目前是一个处理数据的计算引擎, 不做存储。首先咱们通过一张图来看看目前Spark生态圈都包括哪些核心组件 阅读全文
posted @ 2020-10-18 16:32 大数据学习与分享 阅读(508) 评论(0) 推荐(0) 编辑