寒假学习记录第十天
今天弄了一下实验四shell的基础题
请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt,该数据集包含
了某大学计算机系的成绩,数据格式如下所示:
Tom,DataBase,80
Tom,Algorithm,50
Tom,DataStructure,60
Jim,DataBase,90
Jim,Algorithm,60
Jim,DataStructure,80
……
请根据给定的实验数据,在 spark-shell 中通过编程来计算以下内容:
(1)该系总共有多少学生;
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209153954418-722710325.png)
(2)该系共开设来多少门课程;
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209154004459-33417562.png)
(3)Tom 同学的总成绩平均分是多少;
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209154013003-1323258025.png)
(4)求每名同学的选修的课程门数;
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209154020941-1917961282.png)
(5)该系 DataBase 课程共有多少人选修;
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209154030400-464125046.png)
(6)各门课程的平均分是多少;
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209154037877-1218068531.png)
(7)使用累加器计算共有多少人选了 DataBase 这门课
![](https://img2018.cnblogs.com/i-beta/1437073/202002/1437073-20200209154042901-11894401.png)