记一次 sqlserver 中文字符集问题
背景
最近业务反馈搜索品牌的时候,查不到"航㮶" , 其实系统中是有这个品牌的。
经过排查 "航㮶" 这个品牌涉及生僻字,导致查询不出来。
原因是我们的 sqlserver
安装后默认排序规则是:Chinese_PRC_CI_AS
, 查询的时候只能用 Chinese_PRC_BIN
来进行校正。
sql
如下:
SELECT *
FROM dbo.TBrand
WHERE BrandName = N'航㮶' COLLATE Chinese_PRC_BIN;
Chinese_PRC_CI_AS
排序规则
varchar
类型的列使用ANSI
编码,也即GBK
存储数据nvarchar
类型的列使用UTF-16
编码存储数据 , 能存储所有Unicode
字符N'航㮶'
表示字符串使用的是Unicode
编码,sqlserver
引擎会用Unicode
的方式去解析 "航㮶" ,而不是用GBK
编码的方式