会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
yuncannotjava
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2024年1月29日
1/29 学习进度笔记
摘要: SparkSQL数据清洗API 前面我们处理的数据实际上都是已经被处理好的规整数据,但是在大数据整个生产过程中,需要先对数据进行数据清洗,将杂乱无章的数据整理为符合后面处理要求的规整数据。 去重方法dropDuplicates 功能:对DF的数据进行去重,如果重复数据有多条,取第一条 缺失值处理dr
阅读全文
posted @ 2024-01-29 16:27 云云云云云云云云
阅读(3)
评论(0)
推荐(0)
编辑