Hive--关联查询

一 表结构
1.1 医生主表


1.2 医生服务次数表


二 left join查询
1.1 on后面加and条件
1.1.1 sql语句


1.1.2 查询结果


1.1.3 执行计划

 


 

1.2 把条件放在where后面
1.2.1 sql语句


1.2.2 查询结果


 

1.2.3 执行计划
 

 

1.3 子查询
1.3.1 sql语句


1.3.2 查询结果


1.3.3 执行计划

 


 

三 总结
1.不考虑where条件下,left join 会把左表所有数据查询出来,on及其后面的条件仅仅会影响右表的数据(符合就显示,不符合全部为null)

2.在匹配阶段,where子句的条件都不会被使用,仅在匹配阶段完成以后,where子句条件才会被使用,它将从匹配阶段产生的数据中检索过滤

3.所以左连接关注的是左边的主表数据,不应该把on后面的从表中的条件加到where后,这样会影响原有主表中的数据

4.where后面:是先连接然生成临时查询结果,然后再筛选

 on后面:先根据条件过滤筛选,再连接生成临时查询结果

5.对于条件在on加个and还是用子查询,查询结果是一模一样的,至于如何使用这个需要分情况,用子查询的话会多一个maptask,但是如果利用这个子查询能过滤到很多数据的话,用子查询还是比较建议的,因为不会加载太多的数据到内存中,如果过滤数据不多的情况下,建议用on后面加and条件

posted @ 2019-12-27 09:26  IT界一个小学生  阅读(2105)  评论(0编辑  收藏  举报