10.29日总结

一. 单选题(共5题,10分)

1. (单选题, 2分) 在实际应用中,大数据处理不包括哪些类型?B

 
A

基于实时数据流的数据处理

B

基于离线数据的处理

C

复杂的批量数据处理

D

基于历史数据的交互式查询

2. (单选题, 2分) 下列关于Spark的描述,错误的是哪一项?D

 
A

Spark最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发

B

Spark在2014年打破了Hadoop保持的基准排序纪录.

C

Spark用十分之一的计算资源,获得了比Hadoop快3倍的速度

D

Spark运行模式单一

3. (单选题, 2分) 下列说法哪项有误?C

 
A

相对于Spark来说,使用Hadoop进行迭代计算非常耗资源

B

Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘中频繁读取数据

C

Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念

D

Spark可以部署在资源管理器YARN之上,提供一站式的大数据解决方案

4. (单选题, 2分) 下列说法错误的是?A

 
A

RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task

B

Application是用户编写的Spark应用程序

C

一个Job包含多个RDD及作用于相应RDD上的各种操作

D

Directed Acyclic Graph反映RDD之间的依赖关

5. (单选题, 2分) 下列关于RDD说法,描述有误的是?C

 
A

一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合

B

每个RDD可分成多个分区,每个分区就是一个数据集片段

C

RDD是可以直接修改的

D

RDD提供了一种高度受限的共享内存模型

二. 多选题(共5题,10分)

6. (多选题, 2分) Apache软件基金会最重要的三大分布式计算系统开源项目ABC

 
A

Hadoop

B

Spark

C

Storm

D

Hive

7. (多选题, 2分) Spark具有的主要特点包括:ABCD

 
A

运行模式多样

B

运行速度快

C

容易使用

D

通用性

8. (多选题, 2分) Scala的特性包括:BCD

 
A

Scala具备强大的并发性

B

Scala语法复杂

C

Scala兼容Java

D

运行速度快

9. (多选题, 2分) Spark最主要的优点是()CD

 
A

计算模式只能是MapReduce

B

Spark提供了内存计算

C

提供了单一数据集操作类型

D

基于DAG的任务调度执行机制

10. (多选题, 2分) Spark所采用Executor的优点包括:AD

 
A

利用多线程来执行具体的任务

B

多线程之间的数据共享

C

存储模块全部都只能在内存中完成

D

Executor中有一个BlockManager存储模块,有效减少IO开销

三. 简答题(共1题,20分)

11. (简答题, 20分) 以下题目二选一: 1、请写出三个大数据在人类生活中应用的实例,并谈谈自己对大数据的看法。 2、编程实践:参考教程https://dblab.xmu.edu.cn/blog/4322/,任意选择以下一种方式通过Spark API 编写一个独立应用程序。 (一)使用sbt对Scala独立应用程序进行编译打包 (二)使用Maven对Java独立应用程序进行编译打包 (三)使用Maven对Scala独立应用程序进行编译打包 并截图给出代码及运行结果。

我的答案:

 

健康医疗:通过收集和分析大量的患者数据,包括电子健康记录、基因组数据、生活习惯等,医疗研究人员可以更准确地预测疾病风险,开发个性化治疗方案,以及进行药物研发。例如,通过分析患者的遗传信息,医生可以为某些癌症患者提供针对性的靶向治疗。 智能交通系统:大数据被用于实时监控交通流量,优化交通信号灯的控制,减少拥堵。通过分析车辆的位置和速度数据,可以预测交通模式,为城市规划和交通管理提供决策支持。此外,自动驾驶汽车也依赖于大量的数据来提高安全性和效率。 在线购物和推荐系统:电商平台通过分析用户的购物历史、浏览行为和偏好,使用机器学习算法来推荐商品,提高用户的购物体验。这种个性化推荐系统可以增加销售额,同时帮助用户发现他们可能感兴趣的产品。 对于大数据的看法,我认为它是一个强大的工具,能够带来许多积极的变化

 
posted @ 2024-11-05 14:32  Mini-Q  阅读(2)  评论(0编辑  收藏  举报