摘要:
问题 对于给定的文件,应该使用多少个分区? 例如,假设我有一个10GB 文件,3个执行器,每个执行器有 2 个内核,3G内存。 我应该重新分配吗? 我应该使用多少个分区? 做出选择的更好方法是什么? 会默认重新分区么? 分析 Spark可以为一个RDD的每个分区运行一个并发任务,直到并发任务数等于集 阅读全文
摘要:
问题 对于给定的文件,应该使用多少个分区? 例如,假设我有一个10GB 文件,3个执行器,每个执行器有 2 个内核,3G内存。 我应该重新分配吗? 我应该使用多少个分区? 做出选择的更好方法是什么? 会默认重新分区么? 分析 Spark可以为一个RDD的每个分区运行一个并发任务,直到并发任务数等于集 阅读全文
摘要:
GUI里调试Spark JOB 必须先安装好 Spark:https://www.cnblogs.com/yjyyjy/p/12860642.html 视频: https://study.163.com/course/courseLearn.htm?courseId=1210073161&share 阅读全文
|