MySQL关于timestamp和mysqldump的一个“bug”【转】

说是MySQL关于timestamp和mysqldump的一个“bug”,其实是MySQLdump 的时候 对timestamp 类型字段的一个转换问题,一直都没注意。看到这篇文章就知道遇到问题如何处理了。
来自:http://dinglin.iteye.com/blog/1747685

复现

来源于一个同事在做数据转储碰到的的问题,简化如下:

1、建表

drop table if exists tb;

CREATE TABLE tb (

  c timestamp NOT NULL DEFAULT '0000-00-00 00:00:00'

) ENGINE=InnoDB DEFAULT CHARSET=gbk;

insert into tb values(now());

select * from tb;

 返回

mysql> select * from tb;

+---------------------+

| c                   |

+---------------------+

| 2012-12-14 00:42:45 |

+---------------------+

1 row in set (0.00 sec)

 

2、dump“出错”

  mysqldump   -Srun/mysql.sock -uroot   test tb   --where='c="2012-12-14 00:42:45"' | grep INSERT

返回为空,也就是说导不到数据。

分析

从上面的结论看上去,似乎是mysqldump的”bug”,看得到的数据都导不出来。 如果我们先不加where条件,

mysqldump   -Srun/mysql.sock -uroot   test tb    |grep INSERT                         

INSERT INTO `tb` VALUES ('2012-12-13 16:42:45');

接下来我们要说说关于timestamp这个字段类型。

首先,从大小上你可以看出来,它不是个字符串,实际上是一个整型。所以当我们执行 where c=” 2012-12-14 00:42:45”的时候,需要将其转换为整型。这就涉及到转换规则。也就是说,对于相同的时间戳,在不同的时区显示的结果是不一样的。反过来也一样,相同的字符串,在不同的时区解释下,会得到不同的时间戳。

我们来看一下整个mysqldump的结果。在文件头部,可以看到

/*!40103 SET TIME_ZONE='+00:00' */; 字样,说明mysqldump在默认情况下,是按’+00:00’(中时区).

而mysql客户端的默认值呢:

mysql> select @@time_zone;

+-------------+

| @@time_zone |

+-------------+

| SYSTEM      |

+-------------+

 这个SYSTEM表示MySQL取操作系统的默认时区,因此是东8区。如果我们设置为与mysqldump相同时区,

mysql> set time_zone='+00:00';  

Query OK, 0 rows affected (0.00 sec)

 mysql> select * from tb;

+---------------------+

| t                   |

+---------------------+

| 2012-12-13 16:42:45 |

+---------------------+

1 row in set (0.00 sec)

就跟我们上面看到的全表导出的结果一样了。

也就是说,这个问题是因为mysqldump强行设置了时区为中时区造成的。

 解决1

从mysqldump的代码中我们看到,可以用 --tz-utc=0 参数去掉前面的设置时区的动作。这样用的也是默认时区。

mysqldump  --tz-utc=0 -Srun/mysql.sock -uroot   test tb   --where='c="2012-12-14 00:42:45"'  |grep INSERT

INSERT INTO `tb` VALUES ('2012-12-14 00:42:45');

 可以看到,这个貌似就是我们要的结果,导出的结果也很合理。

 进一步

如果这个这么好,为什么mysqldump的开发者不把—tz-utc=0作为默认行为呢?也就是说哦这样做有什么风险?

实际上是因为要防止跨时区导数据。假设你把中国一个机器上的数据导入到美国的一个mysqld(想起@plinux 说的b2b就有这种情况),若不显式地设置一个时区,在导入时就会出错了。因为都用系统默认的时区,相同的字符串值会得到不同的时间戳。如我们前面说的, 时间戳是以整型方式存储的。

 解决2

所以上面的--tz-utc=0存在风险。当然如果你确定源和目标系统时区没变,是ok的。我们讨论看看有没有更保险的方法。

既然是时间戳是保险的,其实可以考虑,用时间戳来做where条件。

mysql> select unix_timestamp(c) from tb;

+-------------------+

| unix_timestamp(c) |

+-------------------+

|        1355416965 |

+-------------------+

按照表里的这个值,我们的dump命令改成

mysqldump   -Srun/mysql.sock -uroot   test tb   --where=' unix_timestamp(c)=1355416965' | grep INSERT

INSERT INTO `tb` VALUES ('2012-12-13 16:42:45');

这次对了,而且与是否使用 --tz-utc=0  无关,都能得到结果,区别只是显示问题。

不过对MySQL比较熟悉的同学就知道,这个写法还是存在一个问题:用不上索引,因为我们在字段上做了unix_timestamp这个操作。有时候我们在这种表上为了导出方便有一个索引专门建在timestamp字段上。 因此想到用逆函数:

mysqldump   -Srun/mysql.sock -uroot   test tb   --where='c= from_unixtime(1355416965)'  | grep INSERT         

INSERT INTO `tb` VALUES ('2012-12-13 16:42:45');

 

posted @ 2012-12-14 18:33  jyzhou  阅读(550)  评论(0编辑  收藏  举报