Hive的执行生命周期

1.入口$HIVE_HOME/bin/ext/cli.sh

2.读取命令processLine分割处理

3.命令的预处理processCmd

　　根据输入命令的第一个记号(Token)，分别进行处理

4.命令的预处理CommandProcess

　　根据输入命令的第一个记号，分别进行处理

5.命令的处理(Driver类的run方法)

编译器Compile：首先检查SQL中表和列是否存在，再利用第三方工具Antlr检查SQL语法是否正确，将正确的SQL解析成抽象语法树(AST)，最后将AST编译成逻辑执行计划Logical Paln
优化器Optimizor：将逻辑执行计划转化成可以运行的物理执行计划Physical Plan，即MR任务执行，并对其进行优化
执行器Executor：调用genMapRed()方法执行优化后的MR任务
获取读写锁：对操作的表获取一个读写锁acquireReadWriteLocks
执行execute：将生成的Task提交hadoopAPI 处理，返回任务的执行时间和状态(成功or失败)

6.获取执行的结果

7.执行清理

posted @ 2015-09-04 14:22 skyl夜阅读(2598) 评论(0) 收藏举报

刷新页面返回顶部