了解大数据的特点、来源与数据呈现方式
了解大数据的特点、来源与数据呈现方式
一、大数据中采用数据的来源
1.国家数据库:
经济数据、历年统计年鉴或人口普查的数据,以及地理信息数据、金融数据、房地产数据、医疗统计数据等
2.企业数据:
公司百度、阿里等公司的用户消费行为数据及社交行为数据。旅游公司的酒店、交通、门票等订单数据,医院的检测数据及死亡病因数据,农业的养殖培育数据等
3.机器设备数据:
行车仪、基站数据、智能家居、智能穿戴设备等
4.个人数据:
个人拍摄的照片、录音、聊天记录、邮件、电话记录、文档等
二、大数据的呈现方式:
-
数据统计图:例如有有条形统计图、扇形统计图、折线统计图、半对数线图、散点图、茎叶统计图,直方图
-
数据统计表:将数据制作成表格呈现
-
数据图形化:将数据制作成图形呈现
-
数据可视化:利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释
三、大数据的特点是什么?对思维方式有何影响?
1.容量大:数据量巨大,来源多渠道
2.种类多:数据类型的多样
3.处理速度快
4.价值密度低:因为数据巨大,在庞大的数据中有写数据有价值而有些数据又利用率低
影响:
1.全样而非抽样:有了大数据技术的支持,科学分析完全可以直接针对全集数据而不是抽样数据,并且可以在短时间内迅速得到分析结果。
2.效率而非精确:需要迅速给出针对海量数据的实时分析结果,否则就会丧失数据的价值
3.相关而非因果:在大数据时代,因果关系不再那么重要,人们转而追求"相关性"而非"因果性"。
四、设计完成一个Mad Libs游戏
代码如下:
name1=input('请输入一个姓名:') time1=input('请输入一个时间点:') location1=input('请输入一个地点:') thing1=input('请输入一件事情:') print('大约在{}的时候,他们很多人在{},一起{},但最后被老师发现的只有{}'.format(time1,location1,thing1,name1))
运行截图如下: