今天主要写了实验4的第一个题目
spark-shell 交互式编程
请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt,该数据集包含
了某大学计算机系的成绩,数据格式如下所示:
Tom | DataBase | 80 |
Tom | Algorithm | 50 |
Tom | DataStructure | 60 |
Jim | DataBase | 90 |
Jim | Algorithm | 60 |
Jim | DataStructure | 80 |
…… |
将Data01.txt放在/usr/local/spark/sparkdata中
权限设置:
(1)该系总共有多少学生;
(2)该系共开设来多少门课程;
(3)Tom 同学的总成绩平均分是多少;
(4)求每名同学的选修的课程门数;
(5)该系 DataBase 课程共有多少人选修;
(6)各门课程的平均分是多少;
(7)使用累加器计算共有多少人选了 DataBase 这门课。
这道题遇到了一点问题
目前只到了这一步
补:第七题