风-fmgao

导航

字符编码

ascii码

1981  gb2312
1995  gbk 21003个汉字
2000 gb18030
unicode 16位(2字节) 65536
utf-8 可变长:ascii用1个字节,欧洲的2个字节,东亚的用3个字节

 

python2默认是ascii码(默认不支持中文)

python3默认是utf8

 

http://www.cnblogs.com/alex3714/articles/7550940.html

 

示例:

'''
有如下字符串:n = "路飞学城"(编程题)

    - 将字符串转换成utf-8的字符编码的字节,再将转换的字节重新转换为utf-8的字符编码的字符串
    - 将字符串转换成gbk的字符编码的字节,再将转换的字节重新转换为utf-8的字符编码的字符串
'''
n = "路飞学城"
# a = n.encode('utf8')
# s = a.decode('utf8')
#py3中默认是unicode,什么规则编码,解码必须对应,unicode是万国码,所以再使用utf8编解码一次,就可以达到需求
a = n.encode('gbk')
s = a.decode('gbk')
b = s.encode('utf8')
d = b.decode('utf8')
print(a, s, b, d)

posted on 2018-05-13 22:50  风-fmgao  阅读(118)  评论(0编辑  收藏  举报