10 期末大作业

https://www.cnblogs.com/798627841qq/p/14667743.html   补01 大数据概述   没注意上交时间

https://www.cnblogs.com/798627841qq/p/14667733.html    补04 RDD编程练习   编程环境出了问题,导致延迟上交时间

https://www.cnblogs.com/798627841qq/p/14667718.html   05 RDD练习:词频统计,学习课程分数  花费时间过长,所以错过上交时间

https://www.cnblogs.com/798627841qq/p/14858661.html  09spark连接mysql数据库   课上已经完成,忘记上交时间

 

大作业:

 

1.选择使用什么数据,有哪些字段,多大数据量。

 

数据:中国疫情数据

 

字段:省份、确诊人数、死亡人数、治愈人数、新增人数

 

2.准备分析哪些问题,可视化方式?(8个以上)

 

(1)中国现有感染人数情况, 地图

 

(2) 中国现有感染人数情况, 柱状图

 

(3)北上广深现有感染人数情况,柱状图

 

(4)中国疫情情况,饼图

 

(5)日新增人数前五的省份,漏斗图

 

(6)日新增感染人数前八个的省份,散点图

 

(7)所有省份词云,词云,

 

(8)现有感染人数前八个的省份, 象型图

 

posted @ 2021-06-07 14:17  15521419744  阅读(77)  评论(0编辑  收藏  举报