了解大数据的特点、来源与数据呈现方式

这个作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639

1.浏览2019春节各种大数据分析报告,例如:

2..这些分析所采用数据的来源是什么?

1)交通运输:根据各交通运输部统计春运期间的购票情况以及购票到达的目的地点来统计春运期间的客流量出入数据,以及各城市人口迁移的数据统计。

2)位置共享:根据腾讯地图、腾讯位置服务发布的《2019春节出行预测大数据报告》,春节“空城”指数最高的十大城市,分别是深圳、东莞、北京、上海、苏州、广州、杭州、郑州、成都、佛山。

3)消费数据:根据淘宝、京东、苏宁易购以及银联支出信息等统计得到春节前后人们消费种类、消费金额等得出消费物件排行榜,也从各大平台得出各地区春节消费的水平以及总体情况。“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。  

4)通讯数据:春节期间通过微信上的微信红包统计得出春节人们主要是通过抢红包来体现春节年味。

3.大数据的呈现方式有哪些?

(1)将指标数值化  

(2)将指标图形化  

(3)将指标关系图形化 

(4)将时间和空间可视化  

(5)将数据进行概念转换  

4.大数据的特点是什么?对思维方式有何影响?

特点:

1、Volume(数据量大)

       所谓的大量,就是指数据量极为庞大,10年前,我们觉得GB已经是不小的单位了,但现在的大数据都已经到达ZB的量级了,这是多么庞大的数量(1ZB=1万亿GB)。而据知名市场调研机构IDC预计,2020年,全球数据总量可达40ZB。

2、Velocity(处理速度快)

       海量数据带来的是更大的挑战,如何快速计算分析大数据已经成为当下热门的话题。举个常见的例子,我们经常使用百度搜索去找自己想要的商品,那么百度是在成千上万的结果中毫秒级的找到符合你关键词的选项呢,这就需要大数据的高速处理能力。

3、Variety(数据类型繁多)

       数据包括两部分,结构化数据以及非结构化数据。结构化数据就是我们常见的Excel表格那种形式,以文字储存为主。而非结构化数据则不同,他更多的是以音频、视频、图片、地理坐标等形式出现,对数据处理的要求也更多。另外,不得不说的是,如今数据量的爆发性增长其实是得益于非结构化数据的。

4、Value(价值密度低)

       海量的数据并不一定有价值,也有可能是废物数据。当下,大数据价值密度低的特性已经被人们所慢慢察觉,如何从数据中找到有价值信息已经成为一个难题。

影响:

       在思维方式方面,大数据具有“全样而非抽样、效率而非精确、相关而非因果”三大显著特征。 在大数据时代,因果关系不再那么重要,人们转而追求相关性而非因果性,例如啤酒和尿布。

1)人们处理的数据从样本数据变成全部数据;

2)由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;

3)人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。

5.

>>> name1=input('请输入你的名字:')
请输入你的名字:tily

>>> name2=input('请输入你的学校:')
请输入你的学校:广州商学院
>>> name3=input('请输入你的专业:')
请输入你的专业:软件工程

>>> name4=input('请输入你的年级:')
请输入你的年级:大三
>>> print('你好,我是{},在{},就读于{}专业的一名{}学生'.format(name1,name2,name3,name4))
>>>

posted @ 2019-03-01 17:14  TILY  阅读(226)  评论(0编辑  收藏  举报