会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
哆啦啦啦
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2021年6月7日
10 期末大作业
摘要: 补: https://www.cnblogs.com/cmy523/p/14860662.html: 06 SPARK SQL 及其DATAFRAME的基本操作 原因:忘了交了 一、.选择使用什么数据,有哪些字段,多大数据量。 us-counties美新冠数据;字段有日期(date),县(count
阅读全文
posted @ 2021-06-07 21:48 哆啦啦啦
阅读(37)
评论(0)
推荐(0)
编辑
06 Spark SQL 及其DataFrame的基本操作
摘要: 1.Spark SQL出现的 原因是什么? spark sql是spark用来处理结构化数据的一个模块,与hive的hql不同,hive需要将hql转化成MapReduce然后提交执行,sparksql将sql语句转换成rdd然后提交集群执行,将执行效率大大提升 2.用spark.read 创建Da
阅读全文
posted @ 2021-06-07 21:41 哆啦啦啦
阅读(45)
评论(0)
推荐(0)
编辑