大数据基础--行业大数据(刘鹏《大数据》课后习题答案)
1.简述密集地震观测网的组成。
地震烈度速报系统、地震预警系统、MEMS传感器烈度仪和智能设备。
2.如何从地震大数据中找出关联性。
不拘泥于对因果关系的研究,向关联、非关联等相关关系探究转变。按照大数据的方式,不管这些数据的手段和学科,也不管它的空间维度和结构,只要出现异常就代入异常度公式计算。
3.简述对异常活动的剧烈程度的参量公式的理解。
我们定义“异常活动度”为“表示某一地块(或某一地质构造单元)在某一t时刻表现为异常活动的剧烈程度的参量”。
4.大数据从哪几方面推进地震新模式和新业态?
(1)密集地震观测网带来的创新
(2)大数据为探寻地震前兆开辟新途径
(3)大数据支撑地震应援救急
(4)物联网大数据的地震应用
5.大数据为智慧交通带来的意义有哪些?
(1)大数据提供环境监测方式
(2)大数据拥有信息集成优势和信息组合效率
(3)大数据的智能性可以合理配置公共交通资源
(4)提高交通安全水平
6.应用于交通行业的数据挖掘技术有哪些?
常见的有分类、聚类、关联算法等
7.数据挖掘的系统模型3个主要阶段分别是什么?
数据的准备、模型的发现、结果的表达和解释
8.简述交通拥堵算法的模型构建过程。
拥堵定义及分析->问题分析->路段行驶时间和流量的关系建模->模型的实现
9.常用的环境数据可以分为哪几类?
(1)环境预测数据,如中国天气每日发布的天气预报。
(2)环境实况数据,中央气象台每小时发布的城市天气实况。
10.环境数据的来源包括哪些方面?
(1)各类传感器产生的环境数据
(2)政府部门,权威机构环境监测系统对外提供的数据服务。
(3)各类第三方环境数据源
(4)政府职能部门,环保机构和非政府组织发表的与环境有关的报告
11.应采用何种存储策略存储环境数据?
(1)海量、数据结构各异->分布式数据存储技术 (如Hadoop集群)
(2)地理信息、较强的关联性->关系型数据库(如MySQL)
12.应采用何种方式实现环境数据可视化?
可采用地图来展示不同城市和测点的环境数据。