2022-06-21 23:27阅读: 61评论: 0推荐: 0

oracle-删除重复数据

删除重复数据

准备重复数据

create table mystudent
(
	stuno number ,
	stuname varchar2(20),
	stuage number 
);
insert into mystudent values(1,'zs',23);
insert into mystudent values(1,'zs',23);

insert into mystudent values(2,'ls',24);
insert into mystudent values(2,'ls',24);

insert into mystudent values(3,'ww',55);

尝试1:distinct

delete from mystudent where stuno in(select distinct stuno from mystudent);
image

数据全部都会被删掉

尝试2:伪列(rowid)

分析
select rowid, s.* from mystudent s;
rowid的组成 AAAST+ AAE AAAAJV AAA:
数据对象号(6位):AAAST+
相关数据文件号(3位):AAE
数据块号(6位):AAAAJV
数据块中行号(3位):AAA

  1. 将重复数据分为一组:
    select min(rowid) from mystudent group by stuno,stuname,stuage ;

  2. 发现数据插入的越晚,rowid越大;数据插入越早,rowid越小。
    image

最终SQL:

delete from mystudent where rowid not in(select min(rowid) from mystudent group by stuno,stuname,stuage);

将相同数据分为一组-->在每组中 找到最小的rowid,即min(rowid) -->删除不是最小的rowid (只保留最初插入的数据) ,即delete from ...not in (...)

本文作者:jiyuchen1

本文链接:https://www.cnblogs.com/jiyuchen1/p/16398797.html

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   姬雨晨  阅读(61)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起