摘要: join内连接操作 阅读全文
posted @ 2018-05-07 11:37 zzhangyuhang 阅读(547) 评论(0) 推荐(0) 编辑
摘要: sortByKey()和sortBy()的使用 阅读全文
posted @ 2018-05-07 11:29 zzhangyuhang 阅读(1383) 评论(0) 推荐(0) 编辑
摘要: keys 、values和mapValues(func)的使用 阅读全文
posted @ 2018-05-07 11:13 zzhangyuhang 阅读(13094) 评论(0) 推荐(2) 编辑
摘要: reduceByKey(func)和groupByKey()的使用和区别 阅读全文
posted @ 2018-05-07 11:02 zzhangyuhang 阅读(25915) 评论(0) 推荐(4) 编辑
摘要: 占位符的使用 阅读全文
posted @ 2018-05-06 22:31 zzhangyuhang 阅读(2978) 评论(0) 推荐(0) 编辑
摘要: spark分区的使用 阅读全文
posted @ 2018-05-05 18:52 zzhangyuhang 阅读(2802) 评论(1) 推荐(0) 编辑
摘要: hive函数 阅读全文
posted @ 2018-05-04 19:20 zzhangyuhang 阅读(758) 评论(0) 推荐(0) 编辑
摘要: spark持久化的理解 阅读全文
posted @ 2018-05-04 12:53 zzhangyuhang 阅读(469) 评论(0) 推荐(0) 编辑
摘要: rdd常用的一些操作 阅读全文
posted @ 2018-05-04 11:41 zzhangyuhang 阅读(544) 评论(0) 推荐(0) 编辑
摘要: rdd的几种创建方式+保存文件 阅读全文
posted @ 2018-05-03 18:34 zzhangyuhang 阅读(390) 评论(0) 推荐(0) 编辑