MySQL时间分组查询
表TESTER
字段:id -- INT
date -- TIMESTAMP
1、如何按年、月、日分组查询?
select DATE_FORMAT(date,'%Y-%m-%d') time, count(*) count from TESTER group by year(date), month(date), day(date);
其中year()、month()、day()分别是提取date中的年、月、日字段。
2、时间分组查询的效率?
在不建立索引时,我100W行数据进行测试,用了以下几种写法,得到性能:
NO INDEX select DATE_FORMAT(date,'%Y-%m-%d') time,count(*) count from TESTER group by time returned in 1.315 sec
NO INDEX select DATE_FORMAT(date,'%Y-%m-%d') time,count(*) count from TESTER group by year(time),month(time),day(time) returned in 1.045 sec
NO INDEX select DATE_FORMAT(date,'%Y-%m-%d') time,count(*) count from TESTER group by year(date),month(date),day(date) returned in 0.624 sec
很明显,直接使用date字段是最优的。在建立索引后:
INDEX ON date select DATE_FORMAT(date,'%Y-%m-%d') time,count(*) count from TESTER group by year(date),month(date),day(date) returned in 0.578 sec
发现与不建索引时差别不算太大,不过当数据量达到千万级别是,提升还是很可观的。
3、如果需要返回Unix时间怎么做?
测试在无索引模式下进行:
返回秒: select UNIX_TIMESTAMP(DATE_FORMAT(date,'%Y-%m-%d')) time,count(*) count from svndb.TlocTask group by year(date),month(date),day(time) returned in 0.640 sec
返回毫秒: select UNIX_TIMESTAMP(DATE_FORMAT(date,'%Y-%m-%d'))*1000 time,count(*) count from svndb.TlocTask group by year(date),month(date),day(time) returned in 0.640 sec
可见,性能还是不错的,可以不用拉到后台去计算。
4、关于DATE_FORMAT(date,format) 函数
根据format字符串格式化date值。下列修饰符可以被用在format字符串中:
%M 月名字(January……December)
%W 星期名字(Sunday……Saturday)
%D 有英语前缀的月份的日期(1st, 2nd, 3rd, 等等。)
%Y 年, 数字, 4 位
%y 年, 数字, 2 位
%a 缩写的星期名字(Sun……Sat)
%d 月份中的天数, 数字(00……31)
%e 月份中的天数, 数字(0……31)
%m 月, 数字(01……12)
%c 月, 数字(1……12)
%b 缩写的月份名字(Jan……Dec)
%j 一年中的天数(001……366)
%H 小时(00……23)
%k 小时(0……23)
%h 小时(01……12)
%I 小时(01……12)
%l 小时(1……12)
%i 分钟, 数字(00……59)
%r 时间,12 小时(hh:mm:ss [AP]M)
%T 时间,24 小时(hh:mm:ss)
%S 秒(00……59)
%s 秒(00……59)
%p AM或PM
%w 一个星期中的天数(0=Sunday ……6=Saturday )
%U 星期(0……52), 这里星期天是星期的第一天
%u 星期(0……52), 这里星期一是星期的第一天
%% 一个文字“%”。
5、MySQL中时间能直接相减吗?
答案是否定的,比如表中有time1、time2两个字段,都是时间类型,想算它们之间的差别(秒为单位)
time1=2014-01-01
time2=2014-01-02
当使用这个判断条件 where (time2 - time1 > 36)时,就会踩坑,MySQL并不会把真正的时间相减,而是拼接起来组成字符串相减 '20140101' - '20140102',这个结果是没有实际意义的。
那么当想要算时间差时,有如下三种方法:
TIME_TO_SEC(TIMEDIFF(t2, t1))
TIMESTAMPDIFF(second, t1, t2) -- 注意,这里t1在前
好了,这次的博客比较短,采用了问答的形式,看看效果吧。