数据库怎么删除相同的内容

重复的数据可能有这样两种情况,第一种: 表中只有某些字段一样,第二种是两行记录完全一样。 
一、对于部分字段重复数据的删除 
1.查询重复的数据   
select 字段1,字段2, count(*) from 表名 group by 字段1,字段2 having count(*) > 1    
例:Select owner from dba_tables group by owner having count(*)>1; 
Select owner from dba_tables group by owner having count(*)=1; //查询出没有重复的数据   
2.删除重复的数据 
delete from 表名 a where 字段1,字段2 in (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1) 
这种删除执行的效率非常低,对于大数据量来说,可能会将数据库吊死。 
另一种高效率的方法是先将查询到的重复的数据插入到一个临时表中,然后再进行删除。 
CREATE TABLE 临时表 AS 

select 字段1,字段2, count(*) as row_num 
from 表名 
group by 字段1,字段2 
having count(*) > 1 
); 
  上面这句话就是建立了临时表,并将查询到的数据插入其中。 
  下面就可以进行这样的删除操作了: 
delete from 表名 a 
where 字段1,字段2 in (select 字段1,字段2 from 临时表);    
3.保留重复数据中最新的一条记录 
在Oracle中,rowid是隐藏字段,用来唯一标识每条记录。所以,只要保留重复数据中rowid最大的一条记录就可以了。   
查询重复数据: 
select a.rowid,a.* from 表名 a 
where a.rowid != ( 
select max(b.rowid) from 表名 b 
where a.字段1 = b.字段1 and a.字段2 = b.字段2 );    
例:selete from dba_tables a 
where a.rowid!=( 
select max(rowid) from test b 
where a.owner=b.owner); 
  删除重复数据,只保留最新的一条数据: 
delete from 表名 a 
where a.rowid != ( 
select max(b.rowid) from 表名 b 
where a.字段1 = b.字段1 and a.字段2 = b.字段2 ) 
  使用临时表实现高效查询 
create table 临时表 as 
(select a.字段1, a.字段2, MAX(a.ROWID) as dataid from 正式表 a 
GROUP BY a.字段1,a.字段2); 
delete from 表名 a 
where a.rowid != 
( select b.dataid from 临时表 b 
where a.字段1 = b.字段1 and 
a.字段2 = b.字段2 ); 
commit; 
  二、对于完全重复记录的删除 
  对于表中两行记录完全一样的情况,可以用下面语句获取到去掉重复数据后的记录: 
select distinct * from 表名 
可以将查询的记录放到临时表中,然后再将原来的表记录删除,最后将临时表的数据导回原来的表中。如下: 
CREATE TABLE 临时表 AS (select distinct * from 表名); 
drop table 正式表; 
insert into 正式表 (select * from 临时表); 
drop table 临时表;   假如想删除一个表的重复数据,可以先建一个临时表,将去掉重复数据后的数据导入到临时表,然后在从临时表将数据导入正式表中,如下: INSERT INTO t_table_bak 
select distinct * from t_table;

以下是补充:

Oracle  数据库中查询重复数据:

select * from employee group by emp_name having count (*)>1;

 Oracle  查询可以删除的重复数据

select t1.* from employee t1 where (t1.emp_name) in (SELECT t2.emp_name from employee t2 group by emp_name having count (*)>1) and t1.emp_id not in (select min(t3.emp_id) from employee t3 group by emp_name having count (*)>1);

Oracle 删除重复数据

delete from employee t1 where (t1.emp_name) in (SELECT t2.emp_name from employee t2 group by emp_name having count (*)>1) and t1.emp_id not in (select min(t3.emp_id) from employee t3 group by emp_name having count (*)>1);

 

---------------------------------------------------列数太多咋办呢-----------------------------------------------------

 

 

Oracle数据库重复的数据一般有两种去重方法,一、完全重复数据去重;二、部分字段数据重复去重。

 

  一、完全重复数据去重方法

  对于表中完全重复数据去重,可以采用以下SQL语句。

  Code

  CREATETABLE"#temp"AS (SELECTDISTINCT * FROM 表名);--创建临时表,并把DISTINCT 去重后的数据插入到临时表中

  truncateTABLE 表名;--清空原表数据

  INSERTINTO 表名(SELECT * FROM"#temp");--将临时表数据插入到原表中

  DROPTABLE"#temp";--删除临时表

  具体思路是,首先创建一个临时表,然后将DISTINCT之后的表数据插入到这个临时表中;然后清空原表数据;再讲临时表中的数据插入到原表中;最后删除临时表。

 

  二、部分数据去重方法

  首先查找重复数据

  select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) > 1

  将上面的>号改为=号就可以查询出没有重复的数据了。

  想要删除这些重复的数据,可以使用下面语句进行删除:

  deletefrom 表名 a where 字段1,字段2 in

  (select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) > 1)

  上面的语句非常简单,就是将查询到的数据删除掉。不过这种删除执行的效率非常低,对于大数据量来说,可能会将数据库卡死。

  基于上述情况,可以先将查询到的重复的数据插入到一个临时表中,然后对进行删除,这样,执行删除的时候就不用再进行一次查询了。如下:

  CREATETABLE 临时表 AS

  (select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) > 1)

  下面就可以进行这样的删除操作了:

  deletefrom 表名 a where 字段1,字段2 in (select 字段1,字段2 from 临时表);

  先建临时表再进行删除的操作要比直接用一条语句进行删除要高效得多。

  上面的语句会把所有重复的全都删除,在oracle中,有个隐藏了自动rowid,里面给每条记录一个唯一的rowid,我们如果想保留最新的一条记录,我们就可以利用这个字段,保留重复数据中rowid最大的一条记录就可以了。

  下面是查询重复数据的一个例子:

  select a.rowid,a.* from 表名 a

  where a.rowid !=

  (

  selectmax(b.rowid) from 表名 b

  where a.字段1 = b.字段1 and

  a.字段2 = b.字段2

  )

  上面括号中的语句是查询出重复数据中rowid最大的一条记录。而外面就是查询出除了rowid最大之外的其他重复的数据了。

  由此,我们要删除重复数据,只保留最新的一条数据,就可以这样写了:

  deletefrom 表名 a

  where a.rowid !=

  (

  selectmax(b.rowid) from 表名 b

  where a.字段1 = b.字段1 and

  a.字段2 = b.字段2

  )

  同理,上述代码的执行效率毕竟低,所以我们可以考虑建立临时表,将需要判断重复的字段、rowid插入临时表中,然后删除的时候在进行比较。

  createtable 临时表 as

  select a.字段1,a.字段2,MAX(a.ROWID) dataid from 正式表 a GROUPBY a.字段1,a.字段2;

  deletefrom 表名 a

  where a.rowid !=

  (

  select b.dataid from 临时表 b

  where a.字段1 = b.字段1 and

  a.字段2 = b.字段2

  );

  commit;

----------------------------------------------------------三--------------------------------------------------------------------

 

 比如现在有一人员表 (表名:peosons)

  若想将姓名、身份证号、住址这三个字段完全相同的记录查询出来

  select p1.*

  from persons p1,persons p2

  where p1.id<>p2.id

  and p1.cardid = p2.cardid and p1.pname = p2.pname and p1.address= p2.address

  可以实现上述效果。

  几个删除重复记录的SQL语句

  1.用rowid方法

  2.用group by方法

  3.用distinct方法

  1。用rowid方法

  据据oracle带的rowid属性,进行判断,是否存在重复,语句如下:

  查数据:

  select * from table1 a where rowid !=(select max(rowid)

  from table1 b where a.name1=b.name1 and a.name2=b.name2……)

  删数据:

  delete from table1 a where rowid !=(select max(rowid)

  from table1 b where a.name1=b.name1 and a.name2=b.name2……)

  2.group by方法

  查数据:

  select count(num), max(name) from student --列出重复的记录数,并列出他的name属性

  group by num

  having count(num) >1 --按num分组后找出表中num列重复,即出现次数大于一次

  删数据:

  delete from student

  group by num

  having count(num) >1

  这样的话就把所有重复的都删除了。

  3.用distinct方法 -对于小的表比较有用

  create table table_new as select distinct * from table1 minux

  truncate table table1;

  insert into table1 select * from table_new;

  查询及删除重复记录的方法大全

  1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断

  select * from people

  where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)

  2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录

  delete from people

  where peopleId in (select peopleId from people group by peopleId

  having count(peopleId) > 1)

  and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)

  3、查找表中多余的重复记录(多个字段)

  select * from vitae a

  where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

  4、删除表中多余的重复记录(多个字段),只留有rowid最小的记录

  delete from vitae a

  where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

  and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

  5、查找表中多余的重复记录(多个字段),不包含rowid最小的记录

  select * from vitae a

  where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

  and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

  (二)

  比方说

  在A表中存在一个字段“name”,

  而且不同记录之间的“name”值有可能会相同,

  现在就是需要查询出在该表中的各记录之间,“name”值存在重复的项;

  Select Name,Count(*) From A Group By Name Having Count(*) > 1

  如果还查性别也相同大则如下:

  Select Name,***,Count(*) From A Group By Name,*** Having Count(*) > 1

  (三)

  方法一

  declare @max integer,@id integer

  declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >; 1

  open cur_rows

  fetch cur_rows into @id,@max

  while @@fetch_status=0

  begin

  select @max = @max -1

  set rowcount @max

  delete from 表名 where 主字段 = @id

  fetch cur_rows into @id,@max

  end

  close cur_rows

  set rowcount 0

  方法二

  "重复记录"有两个意义上的重复记录,一是完全重复的记录,也即所有字段均重复的记录,二是部分关键字段重复的记录,

  比如Name字段重复,而其他字段不一定重复或都重复可以忽略。

  1、对于第一种重复,比较容易解决,使用

  select distinct * from tableName就可以得到无重复记录的结果集。

  如果该表需要删除重复的记录(重复记录保留1条),可以按以下方法删除

  select distinct * into #Tmp from tableName

  drop table tableName

  select * into tableName from #Tmp

  drop table #Tmp

  发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。

  2、这类重复问题通常要求保留重复记录中的第一条记录,操作方法如下

  假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集

  select identity(int,1,1) as autoID, * into #Tmp from tableName

  select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID

  select * from #Tmp where autoID in(select autoID from #tmp2)

  最后一个select即得到了Name,Address不重复的结果集(但多了一个autoID字段,实际写时可以写在select子句中省去此列)

  (四)

  查询重复

  select * from tablename where id in (

  select id from tablename

  group by id

  having count(id) > 1

  )

posted @ 2016-10-25 19:42  丶疏影横斜  阅读(8602)  评论(1编辑  收藏  举报