python之字符编码
python2中默认ASCII中的编解码
s_to_unicode = s.decode("utf-8") #转换成unicode
print(a_to_unicode)
unicode_to gbk = s_to_unicode.encode("gbk") #unicode转换成gbk
print(unicode_to_gbk)
gbk_to_unicode = unicode_to_gbk.decode("gbk") #先解码(不解码是默认ASCII转换),再编码
unicode_to_utf-8 = gbk_to_unicode.encode("utf-8")
print(unicode_to_utf-8)
unicode向下兼容gbk和其他语言,不用再次解码成gbk
python3中默认字符编码unicode (文件编码默认utf-8)
encode.py3
s = "特斯拉"
print(s)
s_to_gbk = s.encode("gbk")
引入b:字节类型,是一种单独的数据类型,是一个0-255之间的全数字的数据类型,------在python3中在编码的同时会将数据转换成bytes数据类型------
bytes类型需要学习