4.17思凡特面试

  1. hive语法重视

  2. hdfs调优

  3. 怎么编写清洗

  4. 怎么写支持压缩的map中间结果

  5. 一些误区  
    1. datanode接受数据是一个块一个块往上传,后面两个节点是依次调用的
    2. 元数据得在namenode内存中加载,而非仅存在磁盘上
    3. Fsimage保存目录和iNode,eidts记录更新操作 两个并不是一致的,第一次就会相当于合并
    4. datanode上也有元信息,汇报给namenode

    5. 容量采用深度优先算法,优先那些资源占用率低的,而公平优先资源差额大的

    6. yarn  查看集群使用内存情况jmap

  6. hive基本类型

     

  7. 如何将数据装载进已有的表中

     location是表建立时用的,load data inpath into是建好以后

  8. hive优化

     

     

     

     

     

posted @   SunShine789  阅读(4)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示