随笔分类 - 字符集相关
摘要:对于系统服务来说,国际化是必须解决的非功能特性之一。因此理解本地化是系统编程的重要一个环节。本节梳理一下本地化相关的设置和影响。 首先看看原因。为什么时区正确很重要呢?因为很多应用的时间计算规则不同,通常是在UTC和本地时间之间不清晰,例如crontab定时任务以及其他定时任务。不同应用基于或返回U
阅读全文
摘要:首先来看下GB2312,GBK以及GB18030的区别。分几个方面: 1、收录汉字 GB2312:基本集共收入汉字6763个和非汉字图形字符682个。 GBK:共收录了21003个汉字。 GB18030 :共收录汉字70244个。 2、兼容性 GB2312:基本满足了汉字的计算机处理需要,对于人名、
阅读全文
摘要:http://peter.eisentraut.org/blog/2022/09/26/icu-features-in-postgresql-15 https://www.postgresql.org/docs/current/collation.html https://dba.stackexch
阅读全文
摘要:zjh@postgres=# show %enc%; name | setting | description + + client_encoding | UTF8 | Sets the client's character set encoding. server_encoding | UTF8
阅读全文
摘要:同样,使用的是VS FOR LINUX进行测试。 converting to execution character set: Invalid or incomplete multibyte or wide character 如果编译时候遇到该错误,则可以加上-finput-charset -fe
阅读全文
摘要:首先要来说一说字符集和编码的关系,这两者既有交叉、又有异同。https://www.runoob.com/w3cnote/charset-encoding.html、https://blog.csdn.net/weixin_44198965/article/details/93125017。简单可以
阅读全文
摘要:今天系统升级,开发、测试说本地环境、测试环境都没有问题,都用ssh client升的,演示环境报错了Data too long for column。 仔细检查了下,表字符集都是utf-8,目测长度肯定没超过。仔细查了下,问题出在character_set_client上。如下所示: mysql>
阅读全文
摘要:昨天因为发生字符集转换相关错误,今天想验证下utf8和gbk中英文下各自空间的差距。这一测试,绝对毁三观,无论中文还是中文+英文,gbk和utf8占用的实际物理大小完全相同,根本不是理论上所述的“UTF-8对中文采用3个字节,对英文采用1个字节,GBK对中英文都采用2个字节”,如下所示: 空表: G
阅读全文