摘要: spark-submit 报错:must specify resource取消关注|1...我的submit.sh内容:/bin/spark-submit \--class abc.package.manclass \--master spark:10.30.40.50:7077 \--execut... 阅读全文
posted @ 2016-01-21 16:44 曾冠奇 阅读(1736) 评论(0) 推荐(0) 编辑
摘要: 最近在搞spark机器学习项目时,碰到了一些小问题。两个数据集要联到一起。比如rdd1=("abc","cde","dfc"),rdd2=(1,2,3)要连接成rdd3=(("abc",1),("cde",2),("dfc",3)),当然,小数据集的时候用zip就可以了。大数据集的时候就有问题了。每... 阅读全文
posted @ 2016-01-21 11:27 曾冠奇 阅读(991) 评论(0) 推荐(0) 编辑