摘要:
一直对spark sql中的join操作感到迷惑, 如果join之前的操作没有进行persist DataFrame的话,是否会存在让之前的transformation重复执行的问题,以及重复多少次。 看一个例子 考虑在map1/map2处设置一个累加器,join之后,看看map1/map2到底执行 阅读全文
posted @ 2022-09-16 19:00 Antel 阅读(225) 评论(3) 推荐(0) 编辑
摘要:
一直对spark sql中的join操作感到迷惑, 如果join之前的操作没有进行persist DataFrame的话,是否会存在让之前的transformation重复执行的问题,以及重复多少次。 看一个例子 考虑在map1/map2处设置一个累加器,join之后,看看map1/map2到底执行 阅读全文
posted @ 2022-09-16 19:00 Antel 阅读(225) 评论(3) 推荐(0) 编辑 |
||