10 期末大作业

https://www.cnblogs.com/qq502414581/p/14856876.html  补09 spark连接mysql数据库  原因:没注意好时间,忘记提交

https://www.cnblogs.com/qq502414581/p/14494812.html  补01 大数据概述                    原因:没注意好时间,忘记提交

 

大作业:

1.选择使用什么数据,有哪些字段,多大数据量。

数据:美国疫情数据

字段:date 日期、county 区县、state 州、cases 确诊人数、deaths 死亡人数

 

2.准备分析哪些问题,可视化方式?(8个以上)

(1)美国累计确诊病例数和死亡数:双柱状图

(2)美国新增确诊病例数和死亡数:折线图

(3)美国各州累计确诊、死亡人数和病死率:表格

(4)美国确诊最多的10个州:词云图

(5)美国死亡最多的10个州:象柱状图

(6)美国确诊最少的10个州:词云图

(7)美国死亡最少的10个州:漏斗图

(8)美国的病死率:饼状图

 

3.当前进展

  已经完成

posted @ 2021-06-07 00:14  3risan  阅读(27)  评论(0编辑  收藏  举报