面试集锦

1、算法题:有2个桶,容量分别为3升和5升,如何得到4升的水,假设水无限使用,写出步骤。
    1)将5升的水倒入3升的桶中,此时5升的桶剩余2升
    2)清空3升的桶,将5升桶里的2升水倒入2升桶中
    3)将盛满5升水的桶向3升的里面倒,倒满为止,此时五升桶里的水为4升

2、racle数据库中有一个表字段name,name varchar2(10),如何在不改变表数据的情况下将此字段长度改为varchar2(2)?

  alter table table_name modify (name varchar2(2))


1、hdfs原理,以及各个模块的职责
    namenode和datanode
2、mr的工作原理
    map和reduce
3、map方法是如何调用reduce方法的
4、shell如何判断文件是否存在,如果不存在该如何处理?
5、fsimage和edit的区别?
6、hadoop1和hadoop2的区别?
笔试:
1、hdfs中的block默认报错几份?
2、哪个程序通常与nn在一个节点启动?并做分析
3、列举几个配置文件优化?
4、写出你对zookeeper的理解
5、datanode首次加入cluster的时候,如果log报告不兼容文件版本,那需要namenode执行格式化操作,这样处理的原因是?
6、谈谈数据倾斜,如何发生的,并给出优化方案
7、介绍一下hbase过滤器
8、mapreduce基本执行过程
9、谈谈hadoop1和hadoop2的区别
10、hbase集群安装注意事项
11、记录包含值域F和值域G,要分别统计相同G值的记录中不同的F值的数目,简单编写过程。
    两次group


 

 

posted @ 2014-06-15 21:37  jseven  阅读(356)  评论(0编辑  收藏  举报