了解大数据的特点、来源与数据呈现方式

 

1.浏览2019春节各种大数据分析报告,例如:

 

 

2..分析所采用数据的来源是什么?

交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。

移动通信数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。

人为数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书、Linkedin等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。

机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。这包括功能设备会创建或生成的数据,例如智能温度控制器、智能电表、工厂机器和连接互联网的家用电器的数据。来自新兴的物联网(Io T)的数据是机器和传感器所产生的数据的例子之一。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等。

互联网上的“开放数据”来源,如政府机构,非营利组织和企业免费提供的数据。

 

3.大数据的呈现方式有哪些?

大数据的呈现一般都为图片或者表的形式。有条形、折线、散点图,其中图形表示还有地理坐标图、树图等。

也有通过数据呈现。比如数据的分类、数据的归纳等。

 

4.大数据的特点是什么?对思维方式有何影响?

大数据有四个特点:

分别是数据体量巨大,数据类型繁多,价值密度低,处理速度快。

大数据对思维方式的影响主要有以下三个方面:

① 人们处理的数据从样本数据变成全部数据。

② 由于是处理处理全部数据,人们不得不接受数据的混杂性,从而放弃对精确性的追求。

③ 放弃对因果关系的渴望,转而关注相关关系。

 

5.准备python编程环境

下载安装

https://www.python.org/

https://www.jetbrains.com/pycharm/download/#section=windows 

基础学习

廖雪峰https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000  

菜鸟教程http://www.runoob.com/python3/python3-tutorial.html 

 

 

6.简单的输入输出编程练习

设计完成一个Mad Libs游戏

 

posted @ 2019-03-01 17:15  胡家琳  阅读(516)  评论(0编辑  收藏  举报