Oracle 树操作(select…start with…connect by…prior)
oracle树查询的最重要的就是select…start with…connect by…prior语法了。依托于该语法,我们可以将一个表形结构的以树的顺序列出来。在下面列述了oracle中树型查询的常用查询方式以及经常使用的与树查询相关的oracle特性函数等,在这里只涉及到一张表中的树查询方式而不涉及多表中的关联等。
1、测试表和测试数据
1 --菜单目录结构表 2 create table tab_menu( 3 id number(10) not null, --主键id 4 title varchar2(50), --标题 5 parentId number(10) --parentId id 6 )
--父节点 insert into tab_menu(id, title, parentId) values(1, '父节点1',0); insert into tab_menu(id, title, parentId) values(2, '父节点2',0); insert into tab_menu(id, title, parentId) values(3, '父节点3',0); insert into tab_menu(id, title, parentId) values(4, '父节点4',0); insert into tab_menu(id, title, parentId) values(5, '父节点5',0); --一级节点 insert into tab_menu(id, title, parentId) values(6, '一级节点6',1); insert into tab_menu(id, title, parentId) values(7, '一级节点7',1); insert into tab_menu(id, title, parentId) values(8, '一级节点8',1); insert into tab_menu(id, title, parentId) values(9, '一级节点9',2); insert into tab_menu(id, title, parentId) values(10, '一级节点10',2); insert into tab_menu(id, title, parentId) values(11, '一级节点11',2); insert into tab_menu(id, title, parentId) values(12, '一级节点12',3); insert into tab_menu(id, title, parentId) values(13, '一级节点13',3); insert into tab_menu(id, title, parentId) values(14, '一级节点14',3); insert into tab_menu(id, title, parentId) values(15, '一级节点15',4); insert into tab_menu(id, title, parentId) values(16, '一级节点16',4); insert into tab_menu(id, title, parentId) values(17, '一级节点17',4); insert into tab_menu(id, title, parentId) values(18, '一级节点18',5); insert into tab_menu(id, title, parentId) values(19, '一级节点19',5); insert into tab_menu(id, title, parentId) values(20, '一级节点20',5); --二级节点 insert into tab_menu(id, title, parentId) values(21, '二级节点21',6); insert into tab_menu(id, title, parentId) values(22, '二级节点22',6); insert into tab_menu(id, title, parentId) values(23, '二级节点23',7); insert into tab_menu(id, title, parentId) values(24, '二级节点24',7); insert into tab_menu(id, title, parentId) values(25, '二级节点25',8); insert into tab_menu(id, title, parentId) values(26, '二级节点26',9); insert into tab_menu(id, title, parentId) values(27, '二级节点27',10); insert into tab_menu(id, title, parentId) values(28, '二级节点28',11); insert into tab_menu(id, title, parentId) values(29, '二级节点29',12); insert into tab_menu(id, title, parentId) values(30, '二级节点30',13); insert into tab_menu(id, title, parentId) values(31, '二级节点31',14); insert into tab_menu(id, title, parentId) values(32, '二级节点32',15); insert into tab_menu(id, title, parentId) values(33, '二级节点33',16); insert into tab_menu(id, title, parentId) values(34, '二级节点34',17); insert into tab_menu(id, title, parentId) values(35, '二级节点35',18); insert into tab_menu(id, title, parentId) values(36, '二级节点36',19); insert into tab_menu(id, title, parentId) values(37, '二级节点37',20); --三级节点 insert into tab_menu(id, title, parentId) values(38, '三级节点38',21); insert into tab_menu(id, title, parentId) values(39, '三级节点39',22); insert into tab_menu(id, title, parentId) values(40, '三级节点40',23); insert into tab_menu(id, title, parentId) values(41, '三级节点41',24); insert into tab_menu(id, title, parentId) values(42, '三级节点42',25); insert into tab_menu(id, title, parentId) values(43, '三级节点43',26); insert into tab_menu(id, title, parentId) values(44, '三级节点44',27); insert into tab_menu(id, title, parentId) values(45, '三级节点45',28); insert into tab_menu(id, title, parentId) values(46, '三级节点46',28); insert into tab_menu(id, title, parentId) values(47, '三级节点47',29); insert into tab_menu(id, title, parentId) values(48, '三级节点48',30); insert into tab_menu(id, title, parentId) values(49, '三级节点49',31); insert into tab_menu(id, title, parentId) values(50, '三级节点50',31); commit;
parentId字段存储的是上级id,如果是顶级父节点,该parentId为0
2、树操作
我们从最基本的操作,逐步列出树查询中常见的操作,所有查询出来的节点以家族中的辈份作比方。
1)查找树中的所有顶级父节点(辈份最长的人)。 假设这个树是个目录结构,那么第一个操作总是找出所有的顶级节点,再根据该节点找到其下属节点。
select * from tab_menu m where m.parentId = 0;
2)查找一个节点的直属子节点(所有儿子)。 如果查找的是直属子类节点,也是不用用到树型查询的。
select * from tab_menu m where m.parentId=1
3)查找一个节点的所有后代子节点(所有后代)。
select * from tab_menu m start with m.id=1 connect by m.parentId=prior m.id
这个查找的是id为1的节点下的所有直属子类节点,包括子辈的和孙子辈的所有直属节点。
当parentId = prior id时,数据库会根据当前的id迭代出parentId与该id相同的记录,所以查询的结果是迭代出了所有的子类记录
4)查找一个节点的直属父节点(父亲)。 如果查找的是节点的直属父节点,也是不用用到树型查询的。
--c-->child, p->parentId select c.id, c.title, p.id parentId_id, p.title parentId_title from tab_menu c, tab_menu p where c.parentId=p.id and c.id=6
5)查找一个节点的所有父节点(祖宗)。
select * from tab_menu m start with m.id=38 connect by prior m.parentId=m.id;
这里查找的就是id为1的所有直属父节点,打个比方就是找到一个人的父亲、祖父等。但是值得注意的是这个查询出来的结果的顺序是先列出子类节点再列出父类节点,prior parentId = id时,数据库会跟据当前的parentId来迭代出与当前的parentId相同的id的记录,所以查询出来的结果就是所有的父类结果。
上面列出两个树型查询方式,第3条语句和第5条语句,这两条语句之间的区别在于prior关键字的位置不同,所以决定了查询的方式不同。
以下是一系列针对树结构的更深层次的查询
6)查询一个节点的兄弟节点(亲兄弟)。
--m.parentId=m2.parentId-->同一个父亲 select * from tab_menu m where exists (select * from tab_menu m2 where m.parentId=m2.parentId and m2.id=6)
7)查询与一个节点同级的节点(族兄弟)。 如果在表中设置了级别的字段,那么在做这类查询时会很轻松,同一级别的就是与那个节点同级的,在这里列出不使用该字段时的实现!
with tmp as( select a.*, level leaf from tab_menu a start with a.parentId is null connect by a.parentId = prior a.id) select * from tmp where leaf = (select leaf from tmp where id = 50);
这里使用两个技巧,一个是使用了level来标识每个节点在表中的级别,还有就是使用with语法模拟出了一张带有级别的临时表。
8)、查询一个节点的父节点的的兄弟节点(伯父与叔父)。
with tmp as( select tab_menu.*, level lev from tab_menu start with parentId is null connect by parentId = prior id) select b.* from tmp b,(select * from tmp where id = 21 and lev = 2) a where b.lev = 1 union all select * from tmp where parentId = (select distinct x.id from tmp x, --祖父 tmp y, --父亲 (select * from tmp where id = 21 and lev > 2) z --儿子 where y.id = z.parentId and x.id = y.parentId);
这里查询分成以下几步。
首先,将第7个一样,将全表都使用临时表加上级别;
其次,根据级别来判断有几种类型,以上文中举的例子来说,有三种情况:
(1)当前节点为顶级节点,即查询出来的lev值为1,那么它没有上级节点,不予考虑。
(2)当前节点为2级节点,查询出来的lev值为2,那么就只要保证lev级别为1的就是其上级节点的兄弟节点。
(3)其它情况就是3以及以上级别,那么就要选查询出来其上级的上级节点(祖父),再来判断祖父的下级节点都是属于该节点的上级节点的兄弟节点。
最后,就是使用union将查询出来的结果进行结合起来,形成结果集。
9)、查询一个节点的父节点的同级节点(族叔)。
这个其实跟第7种情况是相同的。
1 with tmp as( 2 select a.*, level leaf 3 from tab_menu a 4 start with a.parentId is null 5 connect by a.parentId = prior a.id) 6 select * 7 from tmp 8 where leaf = (select leaf from tmp where id = 6) - 1;
基本上,常见的查询在里面了,不常见的也有部分了。其中,查询的内容都是节点的基本信息,都是数据表中的基本字段,但是在树查询中还有些特殊需求,是对查询数据进行了处理的,常见的包括列出树路径等。
补充一个概念,对于数据库来说,根节点并不一定是在数据库中设计的顶级节点,对于数据库来说,根节点就是start with开始的地方。
下面列出的是一些与树相关的特殊需求。
10)、名称要列出名称全部路径。
这里常见的有两种情况,一种是从顶级列出,直到当前节点的名称(或者其它属性);一种是从当前节点列出,直到顶级节点的名称(或其它属性)。举地址为例:国内的习惯是从省开始、到市、到县、到居委会的,而国外的习惯正好相反(老师说的,还没接过国外的邮件,谁能寄个瞅瞅 )。
从顶部开始:
1 select sys_connect_by_path (title, '/') 2 from tab_menu 3 where id = 50 4 start with parentId is null 5 connect by parentId = prior id;
从当前节点开始:
select sys_connect_by_path (title, '/') from tab_menu start with id = 50 connect by prior parentId = id;
oracle只提供了一个sys_connect_by_path函数,却忘了字符串的连接的顺序。在上面的例子中,第一个sql是从根节点开始遍历,而第二个sql是直接找到当前节点,从效率上来说已经是千差万别,更关键的是第一个sql只能选择一个节点,而第二个sql却是遍历出了一颗树来。再次ps一下。
sys_connect_by_path函数就是从start with开始的地方开始遍历,并记下其遍历到的节点,start with开始的地方被视为根节点,将遍历到的路径根据函数中的分隔符,组成一个新的字符串,这个功能还是很强大的。
11)、列出当前节点的根节点。
在前面说过,根节点就是start with开始的地方。
select connect_by_root title, tab_menu.* from tab_menu start with id = 50 connect by prior parentId = id;
connect_by_root函数用来列的前面,记录的是当前节点的根节点的内容。
12)、列出当前节点是否为叶子。
这个比较常见,尤其在动态目录中,在查出的内容是否还有下级节点时,这个函数是很适用的。
1 select connect_by_isleaf, tab_menu.* 2 from tab_menu 3 start with parentId is null 4 connect by parentId = prior id;
connect_by_isleaf函数用来判断当前节点是否包含下级节点,如果包含的话,说明不是叶子节点,这里返回0;反之,如果不包含下级节点,这里返回1。
connect by 是结构化查询中用到的,其基本语法是:
select ... from tablename start with 条件1
connect by 条件2
where 条件3;
例:
select * from table
start with org_id = 'HBHqfWGWPy'
connect by prior org_id = parent_id;
简单说来是将一个树状结构存储在一张表里,比如一个表中存在两个字段:
org_id,parent_id那么通过表示每一条记录的parent是谁,就可以形成一个树状结构。
用上述语法的查询可以取得这棵树的所有记录。
其中:
条件1 是根结点的限定语句,当然可以放宽限定条件,以取得多个根结点,实际就是多棵树。
条件2 是连接条件,其中用PRIOR表示上一条记录,比如 CONNECT BY PRIOR org_id = parent_id就是根据当前org_id迭代出parent_id与该org_id相同的记录,所以
查询的结果是迭代出了所有的子类记录,可以看出是自顶向下
条件3 是过滤条件,用于对返回的所有记录进行过滤。
简单介绍如下:
早扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下:
第一步:从根节点开始;
第二步:访问该节点;
第三步:判断该节点有无未被访问的子节点,若有,则转向它最左侧的未被访问的子节,并执行第二步,否则执行第四步;
第四步:若该节点为根节点,则访问完毕,否则执行第五步;
第五步:返回到该节点的父节点,并执行第三步骤。
总之:扫描整个树结构的过程也即是中序遍历树的过程。
1. 树结构的描述
树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描述, 如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的 每一行中都有一个表示父节点的MGR(除根节点外),通过每个节点的父节点,就可以确定整个树结构。
在SELECT命令中使用CONNECT BY 和蔼START WITH 子句可以查询表中的树型结构关系。其命令格式如下:
SELECT 。。。
CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}
[START WITH];
其中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节 点间的父子关系,PRIOR运算符在一侧表示父节点,在另一侧表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了可以使 用列名外,还允许使用列表达式。START WITH 子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示所有满足查询条件的行作为根节点。
START WITH: 不但可以指定一个根节点,还可以指定多个根节点。
2. 关于PRIOR
运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。
PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如:
CONNECT BY PRIOR EMPNO=MGR
PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。例如:
CONNECT BY EMPNO=PRIOR MGR
在这种方式中也应指定一个开始的节点。
3. 定义查找起始节点
在自顶向下查询树结构时,不但可以从根节点开始,还可以定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。
4.使用LEVEL
在具有树结构的表中,每一行数据都是树结构中的一个节点,由于节点所处的层次位置不同,所以每行记录都可以有一个层号。层号根据节点与根节点的距离确定。不论从哪个节点开始,该起始根节点的层号始终为1,根节点的子节点为2, 依此类推。图1.2就表示了树结构的层次。
5.节点和分支的裁剪
在对树结构进行查询时,可以去掉表中的某些行,也可以剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。
6.排序显示
象在其它查询中一样,在树结构查询中也可以使用ORDER BY 子句,改变查询结果的显示顺序,而不必按照遍历树结构的顺序。
===================补充===================
Start with...Connect By子句递归查询一般用于一个表维护树形结构的应用。
创建示例表:
CREATE TABLE TBL_TEST
(
ID NUMBER,
NAME VARCHAR2(100 BYTE),
PID NUMBER DEFAULT 0
);
插入测试数据:
INSERT INTO TBL_TEST(ID,NAME,PID) VALUES('1','10','0');
INSERT INTO TBL_TEST(ID,NAME,PID) VALUES('2','11','1');
INSERT INTO TBL_TEST(ID,NAME,PID) VALUES('3','20','0');
INSERT INTO TBL_TEST(ID,NAME,PID) VALUES('4','12','1');
INSERT INTO TBL_TEST(ID,NAME,PID) VALUES('5','121','2');
从Root往树末梢递归
select * from TBL_TEST
start with id=1
connect by prior id = pid
从末梢往树ROOT递归
select * from TBL_TEST
start with id=5
connect by prior pid = id