摘要: 1. Spark与Scala的版本问题 官网会给出 Maven Repository上可以查到 2. RDD(Resilent Distributed DataSet) 一组Partition,每个分片都被一个计算任务处理,未指定的话默认是程序分配的CPU core的数目 计算每个Parititio 阅读全文
posted @ 2019-05-06 09:29 akia开凯 阅读(289) 评论(0) 推荐(0) 编辑