了解大数据的特点、来源与数据呈现方式

本次的作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620


 

1.浏览2019春节各种大数据分析报告,例如:


 

2.分析所采用数据的来源有哪些?

(1)有全国的交通局统计,旅游业的统计,餐饮业的统计,等等消费的统计下得出大数据。

(2)各种软件平台的出来的各种所需的数据


 

3.大数据的呈现方式有哪些?

大数据的呈现方式次数最多的就是图形,其中常用的图形是散点图,折线图等。


 

4.大数据的特点是什么?对思维方式有何影响?

大数据的特点:

(1)数据量巨大。例如,人类生产的所有印刷材料的数据量仅为200PB。典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。

(2)数据类型多样。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。

(3)处理速度快。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。

(4)价值密度低。以视频为例,一小时的视频,在不间断的测试过程中,可能有用的数据仅仅只有一两秒。

对思维方式有何影响:

(1)总体性思维

社会科学研究社会现象的总体特征,以往的采样方法一直是主要数据获取手段,这是人类在无法获得总体数据信息条件下的无奈选择。在大数据时代,人们可以获得与分析更多的数据,甚至是与之相关的所有数据,而不再依赖于采样,从而可以带来更全面的认识,可以更清楚地发现样本无法揭示的细节信息。

(2)容错性思维

在大数据时代之前,由于收集的样本信息量比较少,所以必须确保记录下来的数据尽量结构化、精确化,否则,分析得出的结论在推及总体上就会“南辕北辙”的现象,导致数据的准确性大大降低,从而造成分析的结论与实际情况背道而驰,因此,就必须十分注重数据样本的精确思维。

(3)关联性思维

在大数据世界未出现时,人们往往执着于现象背后的因果关系,试图通过有限样本数据来剖析其中的内在关联关系。数据量小的另一个缺陷就是有限的样本数据无法反映出事物之间的普遍性的关联关系。

(4)智能化思维

不断提高机器的自动化、智能化水平始终是人类社会长期不懈努力的方向。计算机的出现极大地推动了自动控制、人工智能和机器学习等新技术的发展,“智能机器人”技术研发也取得了突飞猛进的成果并开始一定应用。


 

5.准备python编程环境

下载安装

https://www.python.org/

https://www.jetbrains.com/pycharm/download/#section=windows 

基础学习

廖雪峰https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000  

菜鸟教程http://www.runoob.com/python3/python3-tutorial.html 


 

6.简单的输入输出编程练习

设计完成一个Mad Libs游戏

 

posted @ 2019-02-26 14:51  huangzhenjie  阅读(163)  评论(0编辑  收藏  举报