10 期末大作业
https://www.cnblogs.com/qq502414581/p/14856876.html 补09 spark连接mysql数据库 原因:没注意好时间,忘记提交
https://www.cnblogs.com/qq502414581/p/14494812.html 补01 大数据概述 原因:没注意好时间,忘记提交
大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
数据:美国疫情数据
字段:date 日期、county 区县、state 州、cases 确诊人数、deaths 死亡人数
2.准备分析哪些问题,可视化方式?(8个以上)
(1)美国累计确诊病例数和死亡数:双柱状图
(2)美国新增确诊病例数和死亡数:折线图
(3)美国各州累计确诊、死亡人数和病死率:表格
(4)美国确诊最多的10个州:词云图
(5)美国死亡最多的10个州:象柱状图
(6)美国确诊最少的10个州:词云图
(7)美国死亡最少的10个州:漏斗图
(8)美国的病死率:饼状图
3.当前进展
已经完成