了解大数据的特点、来源与数据呈现方式
本作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639
一、.浏览2019春节各种大数据分析报告
- 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993
- 春节人口迁徙大数据报告!http://www.sohu.com/a/293854116_679156
- 春节大数据:消费首破万亿 最佳伴手礼竟是教辅书?http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
- 大数据中的春节http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
- 春节年味大数据都有啥 90后年味就是抢红包http://news.zol.com.cn/708/7087625.html
- 春节大数据出炉http://www.sohu.com/a/223982938_100012490
- 2019年微信春节大数据:收发红包人数超8亿http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html
二、这些分析所采用数据的来源
1、春运:春运的数据都是呈现在旅途上,所以一般数据会来自于铁路、航空、水运等交通运输部门,可以采用各种平台上春运售票的基本信息、机器和传感器数据如旅客的定位/ GPS 系统数据等来分析
2、购物:购物大数据主要还是来自于网上的购物平台,如天猫、淘宝等,由于信息量庞大,是分析购物大数据的信息必要来源
3、消费:分析人们的消费习惯的信息可以来自于支付宝等支付平台,它可以对消费信息进行一个分类,能更好的获取到有益的信息
4、娱乐:春节的娱乐方式如旅游、看电影之类的活动,主要可以从美团、猫眼等各种APP或者政府机构、非营利组织和企业免费提供的数据等上面获取
5、微信:春节微信上面的信息发送量主要来自于移动通信等上面得到的数据
三、大数据的呈现方式
大数据主要可以有以下几种呈现方式:
数据统计图、数据图形化、数据统计表、数据可视化、数据关系图形化等
四、大数据的特点
大数据的特点主要是四个“V”:
1、 数据量大(Volume):有大量的数据需要总结处理。
2、 处理速度快(Velocity):市场变化快,所以数据量对速度要求有些“大”。
3、数据类型繁多(Variety):不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作。
4、价值密度低(Value):数据样本不全面数据可能会失真,可以通过更多的数据达到更真实全面的反馈。
五、大数据对思维方式有何影响
1、数据量的变化:人们处理的数据从样本数据变成全部数据;
2、宏观处理数据:由于是获取到全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;
3、关注数据关系:人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。
六、准备、安装python编程环境
1、安装Python环境、
2、安装PyCharm软件
七、设计完成一个Mad Libs游戏
print('~~ss讲故事时间~~') tq=input('请输入天气情况:') name=input('请输入故事主人公名字:') pet=input('请输入一只动物名称:') thing=input('请输入一种东西名称:') eat=input('请输入一种食物:') xq=input('请输入一种心情:') print('今天是{},{}带着他的宝贝{}去爬山,沿途看到了很多{},而且还吃了很多{},{}也很喜欢,所以今天{}的心情很{}!'.format(tq,name,pet,thing,eat,pet,name,xq))
完成截图: