MySQL字段等值查询时,尾部有空格也能匹配上的坑
一、现象
CREATE TABLE `user_info` ( `id` BIGINT(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '主键自增ID', `user_name` VARCHAR(64) NOT NULL DEFAULT '' COMMENT '名字', PRIMARY KEY (`id`), KEY `idx_user_name` (`user_name`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用户表'; INSERT INTO user_info(user_name) values('adu'); #无空格 INSERT INTO user_info(user_name) values('adu '); #一个空格 INSERT INTO user_info(user_name) values('adu '); #四个空格
如上有个user_info表,我们分别插入'adu'、'adu '、'adu '三个用户。
但我们在查询时却遇到一个诡异的现象:
SELECT * FROM user_info WHERE user_name = 'adu'; #无空格 SELECT * FROM user_info WHERE user_name = 'adu '; #一个空格 SELECT * FROM user_info WHERE user_name = 'adu '; #两个空格
SELECT * FROM user_info WHERE user_name = 'adu '; #四个空格
无论查询中尾部带有几个空格,结果是一样的,都会命中'adu'、'adu '、'adu '三个用户。
二、原因
查询MySQL的官方文档(https://dev.mysql.com/doc/refman/5.7/en/char.html),原来MySQL的校对规则基于PAD SPACE,这就意味着CHAR、VARCHAR、TEXT等字符串的等值比较(“=”)会忽略掉尾部的空格。
而且这也符合SQL标准,无需设置也无法改变(参考:https://stackoverflow.com/questions/10495692/mysql-comparison-operator-spaces)。
三、想要精确查询的解决方案
3.1 like
like不会忽略尾部的空格。
SELECT * FROM user_info WHERE user_name LIKE 'adu'; SELECT * FROM user_info WHERE user_name LIKE 'adu '; #一个空格 SELECT * FROM user_info WHERE user_name LIKE 'adu '; #四个空格
3.2 binary
binary不是函数,是类型转换运算符,它用来强制它后面的字符串为一个二进制字符串,可以理解成精确匹配。
SELECT * FROM user_info WHERE user_name = BINARY 'adu'; SELECT * FROM user_info WHERE user_name = BINARY 'adu '; #一个空格 SELECT * FROM user_info WHERE user_name = BINARY 'adu '; #四个空格
注:这里的BINARY关键字要放在“=”的后边,以便有效利用该字段的索引。
四、结论
- MySQL的CHAR、VARCHAR、TEXT等字符串字段在等值比较("=")时,基于PAD SPACE校对规则,会忽略掉尾部的空格;
- 在存储时,不会自动截断尾部的空格,会按原值存储;
- 如果想要精确查询就不能用等值查询(“=”),而应改用like或binary。
五、参考
- 作者:水岩
- 出处:http://www.cnblogs.com/waterystone
- 本博客中未标明转载的文章归作者水岩和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
如果您觉得本文对您的学习有所帮助,可通过支付宝(左) 或者 微信(右) 来打赏博主,增加博主的写作动力