了解大数据的特点、来源与数据呈现方式
一.浏览2019春节各种大数据分析报告,例如:
- 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993
- 春节人口迁徙大数据报告!http://www.sohu.com/a/293854116_679156
- 春节大数据:消费首破万亿 最佳伴手礼竟是教辅书?
- http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
- 大数据中的春节http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
- 春节年味大数据都有啥 90后年味就是抢红包http://news.zol.com.cn/708/7087625.html
- 春节大数据出炉
- http://www.sohu.com/a/223982938_100012490
- 2019年微信春节大数据:收发红包人数超8亿
- http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html
二.这些分析所采用数据的来源是什么?
数据来源:中国铁路,淘宝,微信,百度地图导航等用户在网络上使用后留下的大量的数据信息。
三.大数据的呈现方式有哪些?
词云,数据统计图、数据图形化、数据统计表、数据可视化、数据关系图形化等
四.大数据的特点是什么?结合大数据应用案例,分析大数据对思维方式有何影响?
大数据特点:
1、Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
2、Variety:种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。
3、Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。
4、Velocity:数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。
5、Veracity:数据的准确性和可信赖度,即数据的质量。
大数据对思维方式影响:
1.人们处理的数据从样本数据变成全部数据。
2.由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求。
3.人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。
五.简单的输入输出编程练习
设计完成一个Mad Libs游戏:
1).创造一个让人欢乐的有趣的故事;
2).提示伙伴输入相应类别的词;
3).将故事完整地输出。
代码:
name=input("输入一个名字:") profession=input("输入一个职业:") num=input("输入一个数字:") print("{}是一个{},他从未忘记他现在的处境都是{}年前的事情所造成的。".format(name,profession,num))
截图: