摘要: join内连接操作 阅读全文
posted @ 2018-05-07 11:37 zzhangyuhang 阅读(546) 评论(0) 推荐(0) 编辑
摘要: sortByKey()和sortBy()的使用 阅读全文
posted @ 2018-05-07 11:29 zzhangyuhang 阅读(1321) 评论(0) 推荐(0) 编辑
摘要: keys 、values和mapValues(func)的使用 阅读全文
posted @ 2018-05-07 11:13 zzhangyuhang 阅读(13010) 评论(0) 推荐(2) 编辑
摘要: reduceByKey(func)和groupByKey()的使用和区别 阅读全文
posted @ 2018-05-07 11:02 zzhangyuhang 阅读(25750) 评论(0) 推荐(4) 编辑
摘要: 占位符的使用 阅读全文
posted @ 2018-05-06 22:31 zzhangyuhang 阅读(2959) 评论(0) 推荐(0) 编辑
摘要: spark分区的使用 阅读全文
posted @ 2018-05-05 18:52 zzhangyuhang 阅读(2749) 评论(1) 推荐(0) 编辑
摘要: hive函数 阅读全文
posted @ 2018-05-04 19:20 zzhangyuhang 阅读(734) 评论(0) 推荐(0) 编辑
摘要: spark持久化的理解 阅读全文
posted @ 2018-05-04 12:53 zzhangyuhang 阅读(465) 评论(0) 推荐(0) 编辑
摘要: rdd常用的一些操作 阅读全文
posted @ 2018-05-04 11:41 zzhangyuhang 阅读(536) 评论(0) 推荐(0) 编辑
摘要: rdd的几种创建方式+保存文件 阅读全文
posted @ 2018-05-03 18:34 zzhangyuhang 阅读(384) 评论(0) 推荐(0) 编辑