了解大数据的特点、来源与数据呈现方式

了解大数据的特点、来源与数据呈现方式

 

 一、大数据中采用数据的来源

 

   1.国家数据库

         经济数据、历年统计年鉴或人口普查的数据,以及地理信息数据、金融数据、房地产数据、医疗统计数据等

   2.企业数据

         公司百度、阿里等公司的用户消费行为数据及社交行为数据。旅游公司的酒店、交通、门票等订单数据,医院的检测数据及死亡病因数据,农业的养殖培育数据等

   3.机器设备数据

          行车仪、基站数据、智能家居、智能穿戴设备等

   4.个人数据

         个人拍摄的照片、录音、聊天记录、邮件、电话记录、文档等

 二、大数据的呈现方式:

  1. 数据统计图:例如有有条形统计图、扇形统计图、折线统计图、半对数线图、散点图、茎叶统计图,直方图
  2. 数据统计表:将数据制作成表格呈现
  3. 数据图形化:将数据制作成图形呈现
  4. 数据可视化:利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释

 

  三、大数据的特点是什么?对思维方式有何影响?

 

         1.容量大:数据量巨大,来源多渠道

         2.种类多:数据类型的多样

         3.处理速度快

         4.价值密度低:因为数据巨大,在庞大的数据中有写数据有价值而有些数据又利用率低

影响:

   1.全样而非抽样:有了大数据技术的支持,科学分析完全可以直接针对全集数据而不是抽样数据,并且可以在短时间内迅速得到分析结果。

 

   2.效率而非精确:需要迅速给出针对海量数据的实时分析结果,否则就会丧失数据的价值

   3.相关而非因果:在大数据时代,因果关系不再那么重要,人们转而追求"相关性"而非"因果性"。

 

四、设计完成一个Mad Libs游戏

代码如下:

 

name1=input('请输入一个姓名:')
time1=input('请输入一个时间点:')
location1=input('请输入一个地点:')
thing1=input('请输入一件事情:')
print('大约在{}的时候,他们很多人在{},一起{},但最后被老师发现的只有{}'.format(time1,location1,thing1,name1))

 

运行截图如下:

posted @ 2019-02-25 20:02  TicTac1  阅读(622)  评论(0编辑  收藏  举报