字符编码
ascii码
1981 gb2312
1995 gbk 21003个汉字
2000 gb18030
unicode 16位(2字节) 65536
utf-8 可变长:ascii用1个字节,欧洲的2个字节,东亚的用3个字节
python2默认是ascii码(默认不支持中文)
python3默认是utf8
http://www.cnblogs.com/alex3714/articles/7550940.html
示例:
'''
有如下字符串:n = "路飞学城"(编程题)
- 将字符串转换成utf-8的字符编码的字节,再将转换的字节重新转换为utf-8的字符编码的字符串
- 将字符串转换成gbk的字符编码的字节,再将转换的字节重新转换为utf-8的字符编码的字符串
'''
n = "路飞学城"
# a = n.encode('utf8')
# s = a.decode('utf8')
#py3中默认是unicode,什么规则编码,解码必须对应,unicode是万国码,所以再使用utf8编解码一次,就可以达到需求
a = n.encode('gbk')
s = a.decode('gbk')
b = s.encode('utf8')
d = b.decode('utf8')
print(a, s, b, d)