了解大数据的特点、来源与数据呈现方式
本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639
1.这些分析所采用数据的来源是什么?
(1)交易数据。各大交易平台点击、浏览、交易订单数据;
(2)互联网上的“开放数据”来源。政府机构,非营利组织和企业免费提供的数据;
(3)移动通信数据。移动通信设备上记录的各种数据;
(4)人为数据。各大数据媒体产生的数据流。
2.大数据的呈现方式有哪些?
(1)大数据统计;
(2)空间可视化;
(3)图形统计;
(4)数据排行榜;
(5)关键词可视化。
3.大数据的特点是什么?对思维方式有何影响?
大数据“5V”特点:
(1)Volume:数据量大,包括采集、存储和计算的量都非常大;
(2)Variety:种类和来源多样化。包括结构化、半结构化和非结构化数据;
(3)Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵;
(4)Velocity:数据增长速度快,处理速度也快,时效性要求高;
(5)Veracity:数据的准确性和可信赖度,即数据的质量。
大数据思维不是从某个人的思维出发,而是让海量数据碰撞,寻找相关性,先看到结果再分析原因,冲破了原有的思维框架的局限。
4.简单的输入输出编程练习
设计完成一个Mad Libs游戏:
name1 = input('请输入姓名:')
name2 = input('请输入一个句子:')
name3 = input('请输入一个地点:')
name4 = input('请输入一个物品名称:')
print('阳光明媚的一个上午,{}兴奋地大喊一声{}!\n心满意足的跑去{},捡到了{},于是她开心的像个孩子一样!'.format(name1, name2, name3, name4))