会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
梦里繁花
博客园
首页
新随笔
联系
订阅
管理
2021年10月21日
Spark解决SQL和RDDjoin结果不一致问题(工作实录)
摘要: 问题描述:DataFrame的join结果不正确,dataframeA(6000无重复条数据) join dataframeB(220条无重复数据,由dataframeA转化而来,key值均源于dataframeA) 只有200条数据,丢了20条 问题验证: 1,查询丢的20条数据,均无异常,不存在
阅读全文
posted @ 2021-10-21 11:54 梦里繁花
阅读(457)
评论(0)
推荐(0)
编辑
公告