随笔- 651 文章- 0 评论- 144 阅读- 851万

如转载请注明出处:http://www.cnblogs.com/xd502djj/archive/2010/08/18/1802130.html

以前的一篇删除重复记录的虽然还不错但是在我遇到重量级的大表时还是显的力不从心，不小心想到一种新的方法

思路1、保存不重复的记录

2、保存重复记录中的一个rowid

//3、删除原表中rowid不为步骤2中rowid的记录，留下重复数据中的一条

3.找出记录中rowid为步骤2中rowid的记录

4 、1和3数据连接就是所要的数据了

具体操作例子

第一步：

SQL> create table xxfgs_sig as (select imeid imeid,max(dn) dn,max(xlh) xlh,max(pro_name) pro_name,max(area_name) area_na
me,max(brand) brand,max(m_type) m_type from xxfgs group by imeid having count(*)<2);

第二步：

SQL> create table xxfgs_row as (select max(rowid) rowdata,imeid from xxfgs group by imeid having count(*)>1);

//第三步：////可以考虑给meid建索引

//SQL>delete from xxfgs where rowid not in (select rowdata from xxfgs_row);

//或者

//SQL>delete from xxfgs a where a.rowid <>(select rowdata from xxgs_row b where a.meid=b.meid);

第三步：

SQL>create table xxfgs_dub as (select * from xxfgs where rowid in (select rowdata from xxfgs_row));

第四步：

SQL>insert into xxfgs_sig select * from xxfgs_dub;

////熟练了三四步就可以合成一步了

再来个效率更高的使用partition 就更加灵活和强大效率高了

CREATE TABLE zzcpt_imei_log_sig
AS
   SELECT   IMEID,
            DN,
            XLH,
            PRO_NAME,
            AREA_NAME,
            BRAND,
            M_TYPE,
            reg_time
     FROM   (SELECT   ROW_NUMBER ()
                         OVER (PARTITION BY A.IMEID ORDER BY a.reg_time DESC)
                         rn,
                      a.IMEID,
                      A.DN,
                      A.XLH,
                      a.PRO_NAME,
                      a.AREA_NAME,
                      A.BRAND,
                      A.M_TYPE,
                      a.reg_time
               FROM   zzcpt_imei_log a)
    WHERE   rn = 1;

posted on 2010-08-18 10:48 茄子_2008 阅读(3128) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 百万级群聊的设计实践
· 永远不要相信用户的输入：从 SQL 注入攻防看输入验证的重要性
· 全网最简单！3分钟用满血DeepSeek R1开发一款AI智能客服，零代码轻松接入微信、公众号、小程
· .NET 10 首个预览版发布，跨平台开发与性能全面提升
· 《HelloGitHub》第 107 期

2010年8月

日

一

二

三

四

五

六

如果一件事情你觉得难的完不成，你可以把它分为若干步, 并不断寻找合适的方法。最后你会发现你是个超人。不要给自己找麻烦，但遇到麻烦绝不怕，更不要退缩。
电工查找电路不通点的最快方法是：分段(二分)诊断排除，快速定位。你有什么启示吗?
求知若饥，虚心若愚。
当你对一个事情掌控不足的时候，你需要做的就是“梳理”，并制定相应的规章制度，并使资源各司其职。
官网永远是获得第一时间获得第一手资料的最佳通道。
去繁归简:作为一个程序员，最痛恨的代码就是如老婆的裹脚布又臭又长一样的代码；最崇尚的就是清晰、简洁、模块化的代码。
忌犹豫，宜果断。左右为难作不出决定是一个最坏的决定。
成本、精力、收益不可能三角。你很难在成本、精力和收益三个方面都同时达到最佳状态，通常必须在其中两个因素之间做出平衡和权衡。
我们无法同时提升技术、管理，工作和生活的占比，但我们可以几乎无限的提升他们各自的价值，实现总值的不断增长。

搜索

常用链接

我的标签

随笔档案 (651)

阅读排行榜

评论排行榜

推荐排行榜

最新评论