编码与解码

无论是编码后还是解码后,都是一串字节。

通用语言

编码,解码,必须至少要有一种共同的语言,也就是共同的编码方式,这个通用语言(也是一种字符编码)即是 Unicode
接下来所谓的编码,解码。

编码

将通用语言(Unicode编码)表示的字符(串)重新按另一种编码表示,生成另外一组字节序列。
如,Unicode编码表示下的,abcde,假如为12345,按GBK编码来,处理完后,可能就是45678这一组字节,总之,编码后即为GBK规则下的字节数组。

解码

将所拿到的字节数组,按照对应的编码格式解码还原为Unicode,比如在GBK下面查规则4代表a,5代表b,将45678按GBK规则解析到abcde后,再用Unicode表示,12345,解码完成后为Unicode下的字节数组。

posted @ 2020-07-12 21:18  ecnu_lxz  阅读(285)  评论(0编辑  收藏  举报