PostgreSQL 客户端乱码问题

关于客户端和服务器端的乱码问题, POSTGRESQL字符集问题总结 总结的很详细, 特别棒.

这里让我头痛了很久的问题在于 终端 上字符编码的问题, 由于我的mbp上的 iterm2 的默认编码为 utf-8, 字符显示乱码实际上是由于 iterm2 不能好好显示 GBK 的编码导致的. 平时终端中可以显示中文, 不清楚为何 postgresql shell 中就不行了, 这导致一直没有想到是终端的问题.

关于中文可以正常显示, 我的配置如下

1. 安装 PostgreSQL 的 locale 选择的是 zh_CN.UTF-8
2. 客户端默认编码为 utf-8, 改为 gbk (\encoding 常看当前客户端编码字符集), 有两种方式可以选择: 
    * set client_encoding to 'gbk'
    * \encoding 'gbk'

3. 终端 iterm2 字符编码设置为 'gbk'

引用引文的一个例子

假设服务端编码为UTF-8,客户端工具psgl默认为GBK,

  1. 在此环境下插入“汉字”,一切正常。此时传到客户的“汉字”为GBK编码,自动转为UTF-8编码存到服务端;而查询时,又自动将服务端的UTF-8编码转为GBK来显示,所以没有出现乱码。

  2. 将客户端编码设置为UTF-8,则刚才插入的“汉字”不能正常显示。因为此时客户端和服务端的编码一样,在取数据时不进行任何转换,直接将存在服务端的UTF8编码的字节传到客户端,之后psgl直接显示,所以就乱码了。

  3. 此环境下插入“汉字”,则添加不成功,因为“汉字”直接以GBK的形式传到服务端,UTF8编码不认识,所以就报错。(现在客户端编码为UTF8,所以提示的中文信息也乱码了)。

总结:

1、在此示例中,应用程序psgl,对所输入和获取的字符没做任何处理,直接显示,其使用了pg客户端一样的编码方式(GBK)。
2、在使用时尽量保证客户端编码和操作系统环境一致,不然显示和添加就会出现乱码情况。

posted @ 2017-08-17 18:31  nowgood  阅读(7133)  评论(0编辑  收藏  举报