大数据面试题V3.0 -- HDFS部分
HDFS部分
-
HDFS文件写入和读取流程
-
HDFS组成架构
-
介绍下HDFS,说下HDFS优缺点,以及使用场景
-
HDFS作用
-
HDFS的容错机制
-
HDFS的存储机制
-
HDFS的副本机制
-
HDFS的常见数据格式,列式存储格式和行存储格式异同点,列式存储优点有哪些?
-
HDFS如何保证数据不丢失?
-
HDFS NameNode高可用如何实现?需要哪些角色?
-
HDFS的文件结构?
-
HDFS的默认副本数?为什么是这个数量?如果想修改副本数怎么修改?
-
介绍下HDFS的Block
-
HDFS的块默认大小,64M和128M是在哪个版本更换的?怎么修改默认块大小?
-
HDFS的block为什么是128M?增大或减小有什么影响?
-
HDFS HA怎么实现?是个什么架构?
-
导入大文件到HDFS时如何自定义分片?
-
HDFS的mapper和reducer的个数如何确定?reducer的个数依据是什么?
-
HDSF通过那个中间组件去存储数据
-
HDFS跨节点怎么进行数据迁移
-
HDFS的数据-致性靠什么保证?
-
HDFS怎么保证数据安全
-
HDFS中向DataNode写数据失败了怎么办
-
Hadoop2.xHDFS快照
-
HDFS文件存储的方式?
-
HDFS写数据过程,写的过程中有哪些故障,分别会怎么处理?
-
NameNode存数据吗?
-
使用NameNode的好处
-
HDFS中DataNode怎么存储数据的
-
直接将数据文件上传到HDFS的表目录中,如何在表中查询到该数据?