字符编码

1、utf-8:中文三个字节,英文一个字节。

2、GBK:中英文都是两个字节。

字符串都是unicode码,包括英文,汉字...其他字符 
unicode可以被转化为字节(byte),如何转换呢,就通过gbk、utf-8、gb2312等编码方式。当把字节转换回字符串的时候,也要用相应的编码方式进行转换。 
比如客户端把unicode码通过utf-8转换为二进制流(也就是字节byte),而到了服务器端用gbk编码来把这个二进制流转换为字符串(unicode)的时候,就会出现乱码。必须也要用相应的编码方式进行转换。 

        gbk(encode)                  gbk(decode) 
unicode---------------->byte[]------------------------------>unicode 
String                二进制流                              String

posted @ 2016-11-28 12:02  江境纣州  阅读(12)  评论(0编辑  收藏  举报