摘要: Spark Overview(Spark概述) ·Apache Spark是一种快速通用的集群计算系统。 ·它提供Java,Scala,Python和R中的高级API,以及支持通用执行图的优化引擎。 ·它还支持丰富的高级工具集,包括用于SQL和结构化数据处理的Spark SQL,用于机器学习的MLl 阅读全文
posted @ 2019-04-24 16:01 烽火连城516 阅读(1053) 评论(0) 推荐(0) 编辑
摘要: 1.1 分布式资源调度框架 1.2.1 yarn的概念 Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度,它的引入为 阅读全文
posted @ 2019-04-24 10:06 烽火连城516 阅读(381) 评论(0) 推荐(0) 编辑