在工作中用到了,就返回来看看。
首先查询数据库中重复数据示例SQL
SELECT user_id, count(1) FROM kx_st_user_earning WHERE statistics_type = 3 GROUP BY user_id HAVING count(1) > 1
需求:数据用到了ORDER BY然后分页查询的时候就需要去重然后再计数。
Distinct的作用是用于从指定集合中消除重复的元组,经常和count搭档工作,语法如下
COUNT( { [ ALL | DISTINCT ] expression ] | * } )
这时,可能会碰到如下情况,你想统计同时有多列字段重复的数目,你可能会立马想到如下方法:
select count( distinct col1 , col2 , col3 , .......) from table
但是,这样是不允许的,因为count是不能统计多个字段的,虽然distinct是可行的。
有种比较直接的方法就是把消除重复后在统计查询:
select count(*) from (select distinct col1 ,col2 , col3 from table)A
但是在有些复杂情况下,比如你的统计值可能还需要作为新的临时表的一列,而且这个新表可能还在做些其他复杂查询时候,这样就不是很方便了。
有种方法比较特别,就是把多个字段的当做一个字段去用于消除重复,比如把这个多个字段的字符串连接起来。如下:
selectcount(DISTINCT fcode+cast(fread_date as varchar(30))) from my_table
这种解决方案在某些情况还是挺方便的,虽然效率不高
转载自: http://www.cnblogs.com/xiepeixing/archive/2012/04/18/2583955.html
参考: https://www.cnblogs.com/wslook/