Encoding问题

当我们要把一个字符串转化为byte[]时,习惯性的会用到Encoding.Default.GetBytes(string s)这静态方法。

把一个byte[]数组转化为字符串时,也会习惯性的用到Encoding.Default.GetString(byte[] byte)这个方法。

ok,如果你的客户端(C/S)和服务端用的是相同的操作系统语言,这样是不会用问题。

如果不同呢,不同就出问题,无论用什么编码解析都会出问题,比如utf-8,Unicode解析都是乱码。

下面就是要说的内容了:

首先我们看Encoding.Default返回的是什么东西,MSDN给出的是:

获取操作系统的当前 ANSI 代码页的编码。

那么什么是ANSI代码页编码:百度查吧

不同的操作系统可能使用不同的编码作为默认编码。因此,从一个操作系统流入另一个操作系统的数据可能不会被正确转换。若要确保编码后的字节能够正确解码,应用程序应当使用带前导码的 Unicode 编码(即 UTF8EncodingUnicodeEncodingUTF32Encoding)。另一选择是使用较高级别的协议以确保使用同一格式进行编码和解码。

Default 定义的系统 ANSI 代码页包含 ASCII 字符集,但是其编码不同于 ASCII 的编码。由于所有的 Default 编码会丢失数据,因此应用程序可以改用 UTF8Encoding。在 U+00 到 U+7F 的范围内,UTF-8 通常是相同的,但是可以在不丢失数据的情况下对其他字符进行编码。

这时候就要使用Encoding.的GetEncoding 方法 (String),此方法

返回与指定代码页名称关联的编码;

例如 string str = Encoding.GetEncoding("Korean").GetString(Data);

这样解决了,代码页编码不相同的问题。

 

 

 

 

 

 

 

 

posted @ 2014-01-24 14:39  在路上,  阅读(400)  评论(0编辑  收藏  举报