摘要: IBM在spark summit上分享的内容,包括编译spark源码,运行spark时候常见问题(缺包、OOM、GC问题、hdfs数据分布不均匀等),spark任务堆/thread dump 目录 编译spark的问题 1.正确配置相关环境,如Maven,JRE 2.显示指定你要集成的功能 3.编译 阅读全文
posted @ 2019-09-18 07:38 sw_kong 阅读(248) 评论(0) 推荐(0) 编辑