博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

大数据面试题V3.0 -- HDFS部分


HDFS部分

  1. HDFS文件写入和读取流程

  2. HDFS组成架构

  3. 介绍下HDFS,说下HDFS优缺点,以及使用场景

  4. HDFS作用

  5. HDFS的容错机制

  6. HDFS的存储机制

  7. HDFS的副本机制

  8. HDFS的常见数据格式,列式存储格式和行存储格式异同点,列式存储优点有哪些?

  9. HDFS如何保证数据不丢失?

  10. HDFS NameNode高可用如何实现?需要哪些角色?

  11. HDFS的文件结构?

  12. HDFS的默认副本数?为什么是这个数量?如果想修改副本数怎么修改?

  13. 介绍下HDFS的Block

  14. HDFS的块默认大小,64M和128M是在哪个版本更换的?怎么修改默认块大小?

  15. HDFS的block为什么是128M?增大或减小有什么影响?

  16. HDFS HA怎么实现?是个什么架构?

  17. 导入大文件到HDFS时如何自定义分片?

  18. HDFS的mapper和reducer的个数如何确定?reducer的个数依据是什么?

  19. HDSF通过那个中间组件去存储数据

  20. HDFS跨节点怎么进行数据迁移

  21. HDFS的数据-致性靠什么保证?

  22. HDFS怎么保证数据安全

  23. HDFS中向DataNode写数据失败了怎么办

  24. Hadoop2.xHDFS快照

  25. HDFS文件存储的方式?

  26. HDFS写数据过程,写的过程中有哪些故障,分别会怎么处理?

  27. NameNode存数据吗?

  28. 使用NameNode的好处

  29. HDFS中DataNode怎么存储数据的

  30. 直接将数据文件上传到HDFS的表目录中,如何在表中查询到该数据?

 

posted @ 2022-06-28 15:08  CHANG_09  阅读(157)  评论(0编辑  收藏  举报