Oracle单表去重复(二)
Oracle单表去重
去重有两层含义,一:是记录完全一样。二:是符合一定条件的认为是重复。
根据表的数量,去重可划分为:单表去重和多表关联去重。
对于去重,一般最容易想到的是用distinct,而distinct只能对记录完全重复的记录保留一条。
distinct使用的是二重循环的方式来去重的,如果数据量非常大的时候,会导致性能急剧下降。
我们前一篇文章已经给出了详解,你可以去查看 Oracle单表去重复(一)
下面是一个单表去重的测试,认为name字段相同的即为重复记录,要查询出一个结果,过滤掉重复,distinct显然不能满足要求。
表SQL:
create table A_TEST
(
id number,
name varchar2(20),
remark varchar2(20)
);
insert into A_TEST (ID, NAME, REMARK)
values (1, 'a', 'ss');
insert into A_TEST (ID, NAME, REMARK)
values (2, 'b', 'xxx');
insert into A_TEST (ID, NAME, REMARK)
values (3, 'b', 'x');
insert into A_TEST (ID, NAME, REMARK)
values (4, 'b', 'asd');
insert into A_TEST (ID, NAME, REMARK)
values (5, 'c', 'axxx');
insert into A_TEST (ID, NAME, REMARK)
values (6, 'c', 'asdf');
(
id number,
name varchar2(20),
remark varchar2(20)
);
insert into A_TEST (ID, NAME, REMARK)
values (1, 'a', 'ss');
insert into A_TEST (ID, NAME, REMARK)
values (2, 'b', 'xxx');
insert into A_TEST (ID, NAME, REMARK)
values (3, 'b', 'x');
insert into A_TEST (ID, NAME, REMARK)
values (4, 'b', 'asd');
insert into A_TEST (ID, NAME, REMARK)
values (5, 'c', 'axxx');
insert into A_TEST (ID, NAME, REMARK)
values (6, 'c', 'asdf');
去重方式一(低效):
select a.*
from A_TEST a, (select min(id) as id from A_TEST t group by name) b
where a.id = b.id;
from A_TEST a, (select min(id) as id from A_TEST t group by name) b
where a.id = b.id;
去重方式一(高效):
select *
from (select a.*, rownum row_num from A_TEST a) x
where x.row_num in (select min(rownum) from A_TEST t group by name)
from (select a.*, rownum row_num from A_TEST a) x
where x.row_num in (select min(rownum) from A_TEST t group by name)
可见,使用rownum的效率比使用id的效率要高,当表数据量很大的时候,差距会很明显。
关注我】。(●'◡'●)
如果,您希望更容易地发现我的新博客,不妨点击一下绿色通道的【因为,我的写作热情也离不开您的肯定与支持,感谢您的阅读,我是【Jack_孟】!
本文来自博客园,作者:jack_Meng,转载请注明原文链接:https://www.cnblogs.com/mq0036/p/3701661.html
【免责声明】本文来自源于网络,如涉及版权或侵权问题,请及时联系我们,我们将第一时间删除或更改!
posted on 2014-04-30 16:41 jack_Meng 阅读(2822) 评论(0) 编辑 收藏 举报