了解大数据的特点,来源与数据的呈现方式
作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620
1.分析所采用数据的来源有哪些?
作业文档中数据的来源有,航空公司的购票记录,文章中文字出现频率,百度地图出行记录,京东购买记录,微信红包发送记录等。
由此可知,数据可来源于网站的爬取也可以从文档中获取。
2.大数据的呈现方式有哪些?
大数据呈现的方式有图、表。
3.大数据的特点是什么?对思维方式有何影响?
大数据的特点(4V):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值);
对思维方式的影响:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类
通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。
大数据思维最关键的转变在于从自然思维转向智能思维,使得大数据像具有生命力一样,获得类似于“人脑”的智能,甚至智慧。在很多情况下,一旦我们完成了对大数据
的相关关系分析,而又不再满足于仅仅“是什么”时,我们就会继续朝向因果关系的研究,寻求“为什么”并且基于相关关系的分析,进一步寻求因果关系将会大大降低其分
析成本。其实,因果关系就是一种特殊的相关关系。
6.简单的输入输出编程练习:设计完成一个Mad Libs游戏