会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
dy9776
博客园
首页
新随笔
联系
订阅
管理
2017年3月16日
spark dataframe操作集锦(提取前几行,合并,入库等)
摘要: Spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能。当然主要对类SQL的支持。 在实际工作中会遇到这样的情况,主要是会进行两个数据集的筛选、合并,重新入库。 首先加载数据集,然后在提取数据集的前几行过程中,才找到limit的函数。 而合并就用到union函数,重新入库,就
阅读全文
posted @ 2017-03-16 14:28 dy9776
阅读(24625)
评论(0)
推荐(0)
编辑
公告