如转载请注明出处:http://www.cnblogs.com/xd502djj/archive/2010/08/18/1802130.html
以前的一篇删除重复记录的虽然还不错 但是在我遇到重量级的大表时还是显的力不从心,不小心想到一种新的方法
思路1、保存不重复的记录
2、保存重复记录中的一个rowid
//3、删除原表中rowid不为步骤2中rowid的记录 ,留下重复数据中的一条
3.找出记录中rowid为步骤2中rowid的记录
4 、1和3数据连接就是所要的数据了
具体操作例子
第一步:
SQL> create table xxfgs_sig as (select imeid imeid,max(dn) dn,max(xlh) xlh,max(pro_name) pro_name,max(area_name) area_na
me,max(brand) brand,max(m_type) m_type from xxfgs group by imeid having count(*)<2);
第二步:
SQL> create table xxfgs_row as (select max(rowid) rowdata,imeid from xxfgs group by imeid having count(*)>1);
//第三步:////可以考虑给meid建索引
//SQL>delete from xxfgs where rowid not in (select rowdata from xxfgs_row);
//或者
//SQL>delete from xxfgs a where a.rowid <>(select rowdata from xxgs_row b where a.meid=b.meid);
第三步:
SQL>create table xxfgs_dub as (select * from xxfgs where rowid in (select rowdata from xxfgs_row));
第四步:
SQL>insert into xxfgs_sig select * from xxfgs_dub;
////熟练了三四步就可以合成一步了
再来个效率更高的 使用partition 就更加灵活 和强大 效率高了
CREATE TABLE zzcpt_imei_log_sig
AS
SELECT IMEID,
DN,
XLH,
PRO_NAME,
AREA_NAME,
BRAND,
M_TYPE,
reg_time
FROM (SELECT ROW_NUMBER ()
OVER (PARTITION BY A.IMEID ORDER BY a.reg_time DESC)
rn,
a.IMEID,
A.DN,
A.XLH,
a.PRO_NAME,
a.AREA_NAME,
A.BRAND,
A.M_TYPE,
a.reg_time
FROM zzcpt_imei_log a)
WHERE rn = 1;
本文来自博客园,作者:茄子_2008,转载请注明原文链接:https://www.cnblogs.com/xd502djj/archive/2010/08/18/1802130.html
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 百万级群聊的设计实践
· 永远不要相信用户的输入:从 SQL 注入攻防看输入验证的重要性
· 全网最简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程
· .NET 10 首个预览版发布,跨平台开发与性能全面提升
· 《HelloGitHub》第 107 期