【Spark实战高手之路-从零开始 读书笔记】前言
要想成为Spark高手,需要经历6个阶段:
1、熟练的掌握Scala语言
2、精通Spark平台本身提供给开发者的API
3、深入Spark内核
4、掌握基于Spark上的核心框架应用
5、做商业级别的Spark项目
6、提供Spark解决方案
第一阶段
由于Spark框架是采用Scala语言编写的,因此最快速和支持最好的API依然并将永远是Scala方式的API,所以你必须掌握Scala来编写复杂的和高性能的Spark分布式程序。尤其要熟练掌握Scala的trait、apply、函数式编程,泛型、逆变和协变等。
推荐课程“精通Spark开发语言:Scala最佳实践”
第二阶段
掌握Spark中面向RDD的开发模式,掌握各种transformation和action函数的用法
掌握Spark中狂依赖和债以来以及lineage机制
掌握RDD的计算流程,如stage的划分、Spark应用陈旭提交给集群的基本过程以及工作原理
推荐课程“18小时内掌握Spark:把云计算大数据速度提高100倍以上课程”
http://www.mamicode.com/info-detail-379871.html