摘要:
1.描述一下hadoop工作流引擎Azkaban: azkaban是一个任务调度器,可以调度我们的任务,解决每个任务间的依赖关系,让任务依赖被依赖的会在前面的执行,在这个任务执行完了后再进行执行后面的任务。 阅读全文
摘要:
1.简述sqoop的功能: sqoop是一个用来将hdfs和关系型数据库的数据相互转移的工具,可以将一个关系型数据库中的数据导进到hadoop的hdfs中,也可以将hdfs的数据导进到关系型数据库。 阅读全文
摘要:
1.简述hdfs的副本存放策略: 默认是3个副本,本机架本地存放一个,本机架非本地存放一个,非本机架存放一个。 阅读全文
摘要:
1.hadoop2.0和hadoop1.0的区别: hadoop2.0比hadoop1.0多了资源管理器YARN,hadoop还增加了HA高可靠机制。 阅读全文