摘要:
1.请分析SparkSQL出现的原因,并简述SparkSQL的起源与发展。 原因: 关系数据库已经很流行 关系数据库在大数据时代已经不能满足要求,首先,用户需要从不同数据源执行各种操作,包括结构化和非结构化数据,其次用户需要执行高级分析,比如机器学习和图像处理 从实际大数据应用中,经常需要融合关系查 阅读全文
posted @ 2022-06-07 22:01
甘琳
阅读(63)
评论(0)
推荐(0)
摘要:
8. SparkSQL综合作业 综合练习:学生课程分数 网盘下载sc.txt文件,分别创建RDD、DataFrame和临时表/视图; 分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析: 总共有多少学生? 总共开设了多少门课程? 每个学生选修了多少门课? 每门 阅读全文
posted @ 2022-06-07 21:44
甘琳
阅读(80)
评论(0)
推荐(0)