4.17思凡特面试

hive语法重视
hdfs调优
怎么编写清洗
怎么写支持压缩的map中间结果
一些误区
1. datanode接受数据是一个块一个块往上传，后面两个节点是依次调用的
2. 元数据得在namenode内存中加载，而非仅存在磁盘上
3. Fsimage保存目录和iNode，eidts记录更新操作两个并不是一致的，第一次就会相当于合并
4. datanode上也有元信息，汇报给namenode
5. 容量采用深度优先算法，优先那些资源占用率低的，而公平优先资源差额大的
6. yarn 查看集群使用内存情况jmap
hive基本类型
如何将数据装载进已有的表中

location是表建立时用的，load data inpath into是建好以后
hive优化

posted @ 2024-05-22 14:52 SunShine789 阅读(26) 评论(0) 收藏举报

刷新页面返回顶部