这次作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639
1.浏览2019春节各种大数据分析报告,例如:
- 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993
- 春节人口迁徙大数据报告!http://www.sohu.com/a/293854116_679156
- 春节大数据:消费首破万亿 最佳伴手礼竟是教辅书?
- http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
- 大数据中的春节http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
- 春节年味大数据都有啥 90后年味就是抢红包http://news.zol.com.cn/708/7087625.html
- 春节大数据出炉
- http://www.sohu.com/a/223982938_100012490
- 2019年微信春节大数据:收发红包人数超8亿
- http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html
2.这些分析所采用数据的来源是什么?
(1)根据各大运营公司以及国家相关统计局的数据搜索及统计,可以得出春节交通出行量,春节旅游情况,春节消费情况,春节抢红包情况。
(2)各种机器和传感器记录,来自感应器、GPS定位系统数据。
(3)支付平台交易记录,主流支付途径支付以及购票记录。
(4)庞大的互联网记录,根据用户发出的信息预测。
3.大数据的呈现方式有哪些?
(1) 将指标数值化,春节空城指数运用了这一方法。
(2)将指标图形化,主要城市流动人口运用了这一方法。
(3)将指标关系图形化,北上广历年人口增量运用了这一方法。
(4)将时间和空间可视化,春节人口流量图运用了这一方法。
(5)将数据进行概念转换,京东商品消费排行。
4.大数据的特点是什么?结合大数据应用案例,分析大数据对思维方式有何影响?
大数据的特点(4V):
(1) 数据量大(Variety),产生TB,PB,乃至EB数据量的数据需要分析处理。
(2)数据类型繁多(Variety),不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据。
(3)价值密度低(Value),由于数据采集的不及时,出现数据样本不全面,数据可能不连续等等问题,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。
(4)处理速度快(Velocity),快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”。
大数据对思维方式的影响:
所谓思维方式, 就是我们大脑活动的内在程序,是一种习惯性的思考问题和处理问题的模式,它涉及我们看待事物的角度、 方式和方法, 并由此对我们的行为方式产生直接的影响。
大数据思维可以产生城市管理的新方法。自美国大使馆每天公布PM2.5指数以后,城市空气污染的问题得到了国家各大政府和公民的重视。使PM2.5检测数据的采集成为了环境保护和管理的一个重要任务。
大数据思维也可以对历史数据的分析提供新方法。美国的国会图书馆正在进行藏书数码化的活动。该活动能使通过电脑搜索关键词,分析相关字条和数据将会变得非常容易,读万卷书可能只是几小时的“小任务”。
大数据思维最具价值的其实还是帮助各大商业机构开创新的商业模式。不论是在美国出现的Uber,还是后来中国兴起的滴滴出行,都是基于大数据思维产生的经典020(网上网下完美结合)新型商业模式。现代智能手机的普及,使实时定位、数据传递及信息沟通成为了可能。
5.准备python编程环境
下载安装
Phthon环境 https://www.python.org/
PhCharm软件 https://www.jetbrains.com/pycharm/download/#section=windows
基础学习
廖雪峰 https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
菜鸟教程 http://www.runoob.com/python3/python3-tutorial.html
6.简单的输入输出编程练习
设计完成一个Mad Libs游戏:
1).创造一个让人欢乐的有趣的故事;
2).提示伙伴输入相应类别的词;
3).将故事完整地输出。