分布式数据库Hbase
8. (多选题, 2分)关系数据库已经流行很多年,并且Hadoop已经有了HDFS和MapReduce,为什么需要HBase?
- A. Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于Hadoop MapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求上
- B. HDFS面向批量访问模式,不是随机访问模式
- C. 传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题
- D. 传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间
正确答案: ABCD:Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于Hadoop MapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求上; HDFS面向批量访问模式,不是随机访问模式; 传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题; 传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间;
9. (多选题, 2分)HBase与传统的关系数据库的区别主要体现在以下哪几个方面?
- A. 数据类型
- B. 数据操作
- C. 存储模式
- D. 数据维护
正确答案: ABCD:数据类型; 数据操作; 存储模式; 数据维护;
10. (多选题, 2分)下列关于数据模型的描述,哪些是正确的?
- A. HBase采用表来组织数据,表由行和列组成,列划分为若干个列族
- B. 每个HBase表都由若干行组成,每个行由行键(row key)来标识
- C. 列族里的数据通过列限定符(或列)来定位
- D. 每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引
正确答案: ABCD:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族; 每个HBase表都由若干行组成,每个行由行键(row key)来标识; 列族里的数据通过列限定符(或列)来定位; 每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引;
11. (多选题, 2分)HBase的实现包括哪三个主要的功能组件?
- A. 库函数:链接到每个客户端
- B. 一个Master主服务器
- C. 许多个Region服务器
- D. 廉价的计算机集群
正确答案: ABC:库函数:链接到每个客户端; 一个Master主服务器; 许多个Region服务器;
12. (多选题, 2分)HBase的三层结构中,三层指的是哪三层?
- A. Zookeeper文件
- B. 数据类型
- C. -ROOT-表
- D. .META.表
- 正确答案: ACD:Zookeeper文件; -ROOT-表; .META.表;
13. (多选题, 2分)Zookeeper是一个很好的集群管理工具,被大量用于分布式计算,它主要提供什么服务?
- A. 配置维护
- B. 域名服务
- C. 负载均衡服务
- D. 分布式同步
- 正确答案: ABD:配置维护; 域名服务; 分布式同步;
14. (多选题, 2分)下列关于Region服务器工作原理的描述,哪些是正确的?
- A. 每个Region服务器都有一个自己的HLog 文件
- B. 每次刷写都生成一个新的StoreFile,数量太多,影响查找速度
- C. 合并操作比较耗费资源,只有数量达到一个阈值才启动合并
- D. Store是Region服务器的核心
正确答案: ABCD:每个Region服务器都有一个自己的HLog 文件; 每次刷写都生成一个新的StoreFile,数量太多,影响查找速度; 合并操作比较耗费资源,只有数量达到一个阈值才启动合并; Store是Region服务器的核心;
15. (多选题, 2分)下列关于HLog工作原理的描述,哪些是正确的?
- A. 分布式环境必须要考虑系统出错。HBase采用HLog保证
- B. HBase系统为每个Region服务器配置了一个HLog文件
- C. Zookeeper会实时监测每个Region服务器的状态
- D. Master首先会处理该故障Region服务器上面遗留的HLog文件
正确答案: ABCD:分布式环境必须要考虑系统出错。HBase采用HLog保证; HBase系统为每个Region服务器配置了一个HLog文件; Zookeeper会实时监测每个Region服务器的状态; Master首先会处理该故障Region服务器上面遗留的HLog文件;