摘要: Spark性能优化指南——高级篇 李雪蕤 ·2016-05-12 14:47 前言 继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。 数据倾斜调优 调优概述 有的 阅读全文
posted @ 2018-01-04 17:35 yimison 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 一.指定spark executor 数量的公式 executor 数量 = spark.cores.max/spark.executor.cores spark.cores.max 是指你的spark程序需要的总核数 spark.executor.cores 是指每个executor需要的核数 参 阅读全文
posted @ 2018-01-04 14:49 yimison 阅读(9970) 评论(0) 推荐(0) 编辑