摘要: repartition 增加或减少分区。会产生shuffle。(多个分区分到一个分区不会产生shuffle) coalesce coalesce常用来减少分区,第二个参数是减少分区的过程中是否产生shuffle。 true为产生shuffle,false不产生shuffle。默认是false。 如果 阅读全文
posted @ 2019-03-25 20:52 pursue330 阅读(319) 评论(0) 推荐(0) 编辑
摘要: 建立如图maven工程 maven的pom文件内容参考别的随笔 参考pom文件内容 同时记得添加scala oom内存溢出异常(out of memory) 阅读全文
posted @ 2019-03-25 19:39 pursue330 阅读(1394) 评论(0) 推荐(0) 编辑
摘要: 下载 http://spark.apache.org/downloads.html 下载2.3.1 https://blog.csdn.net/qq_15349687/article/details/82748074(齐全) 配置文件 https://www.cnblogs.com/purstar/ 阅读全文
posted @ 2019-03-25 19:15 pursue330 阅读(3376) 评论(0) 推荐(1) 编辑
摘要: <?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:sch 阅读全文
posted @ 2019-03-25 14:05 pursue330 阅读(312) 评论(0) 推荐(0) 编辑