Java和C++通过Socket通信中文乱码的解决

理想的开发状态是我开始就是C开发,一直是C的开发,现在还是C的开发,若干年后,幸运的话,我可以成为C语言的高手或者专家……

更实际的情况是我开始是C开发,后来变成了JAVA开发,然后又做起了VC++的开发,几年下来,发现自己几乎一无所长,成为了编程界的万金油,这种产物很重要,但是也比较尴尬。

 

前一段时间我用C开发了一个服务器程序,前端是VC开发的客户端。

现在我用JAVA开发了一个类似的服务器程序,前端依然是VC开发的客户端,运行时发现,中文乱码了。

 

先说说我的问题场景,很常见:

1 VC++客户端请求Java服务器,Java服务器从mysql数据库里读取中文字符串,然后通过Socket发送给客户端。

我以前也遇到编码的问题,用GBK,GB2312,UTF-8一顿乱转,竟然解决了。这次我如法炮制,各种转,都失败了。

再次感谢互联网,在网上查了不少的资料,看到了不少的说法,尝试了好多都没有成功。

即便如此,还是有不少的启发,沉下来自己去分析自己的代码,最终幸运的解决了,现在梳理一下自己的思路,希望也许某一天能帮到正在抓耳挠腮的你。

 

①数据库编码

我的mysql数据库的编码是默认的latin1,打开数据库,发现存储的中文字符串是乱码。这说明我存的不是latin1编码,那是什么呢?

②数据库插入

数据库中的数据是通过WEB软件插入的,查看得知插入的中文字符编码是gb2312。

③数据库访问

再看一下数据库的编码情况,在数据库中执行命令如下:

 1 mysql> show variables like '%char%';
 2 +--------------------------+----------------------------+
 3 | Variable_name | Value |
 4 +--------------------------+----------------------------+
 5 | character_set_client | latin1 |
 6 | character_set_connection | latin1 |
 7 | character_set_database | latin1 |
 8 | character_set_filesystem | binary |
 9 | character_set_results | latin1 |
10 | character_set_server | latin1 |
11 | character_set_system | utf8 |
12 | character_sets_dir | /usr/share/mysql/charsets/ |
13 +--------------------------+----------------------------+

我们需要重点关注的是以下几个配置:

| character_set_client | latin1 |    客户端的字符集

| character_set_connection | latin1 |    连接字符集

| character_set_results | latin1 |    结果字符集

可以在访问数据库时,通过发送语句【set names gb2312】设置需要的编码格式。

我没有在访问数据库时手动的设置编码,所以得到的结果集应该是latin1编码。

④编码转换

按照以上的步骤分析,就是现在我的Java程序得到的是latin1编码的字符串,我需要正确的把它编码为原始的gb2312。

感谢Java的便捷,一句话就完成了两次编码转换:

1 String encodeStr = new String(mysqlResult.getBytes("iso-8859-1"),"gb2312")  //latin1编码在Java中的编码标识为"iso-8859-1"。

此时在程序中经过打印论证了编码的正确性,能够得到WEB页面实际输入的中文字符串。

⑤Socket发送

然后我信心满满的将这个转换后的结果通过BufferedWriter发送给VC++客户端。

结果,竟然还是乱码!!!

这是为什么呢???

再次的查找资料,得到了结论:

Java通过Socket发送的字符流默认编码格式为utf-8,而VC++的Socket默认的字符接收编码方式为gb2312。

只需要修改Java端的Socket发送编码即可:

1 BufferedWriter out = new BufferedWriter(new OutputStreamWriter(clientSocket.getOutputStream(),"gb2312"));

OK,至此,我的VC++客户端能够正确的显示中文字符了。

如果其中我理解的原理有偏差,还望各位朋友不吝赐教。

posted @ 2015-09-24 15:15  一沙世界  阅读(13895)  评论(2编辑  收藏  举报