记一次 sqlserver 中文字符集问题

背景

最近业务反馈搜索品牌的时候,查不到"航㮶" , 其实系统中是有这个品牌的。

经过排查 "航㮶" 这个品牌涉及生僻字,导致查询不出来。

原因是我们的 sqlserver 安装后默认排序规则是:Chinese_PRC_CI_AS , 查询的时候只能用 Chinese_PRC_BIN 来进行校正。

sql 如下:

SELECT *
FROM dbo.TBrand
WHERE BrandName = N'航㮶' COLLATE Chinese_PRC_BIN;

Chinese_PRC_CI_AS 排序规则

  • varchar 类型的列使用 ANSI 编码,也即 GBK 存储数据
  • nvarchar 类型的列使用 UTF-16 编码存储数据 , 能存储所有 Unicode 字符
  • N'航㮶' 表示字符串使用的是 Unicode 编码,sqlserver 引擎会用 Unicode 的方式去解析 "航㮶" ,而不是用 GBK 编码的方式

参考文档

https://blog.csdn.net/u010476739/article/details/118556700

posted on 2022-07-01 13:12  爱上键盘的蜗牛  阅读(409)  评论(0编辑  收藏  举报

导航