Python编码
默认编码:
python3里默认编码是unicode
unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), 所以utf-16就是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf8省空间
转换方法:
在进行编码转换时,需要先解码(decode())成Unicode,再进行编码(encode())
如果需要将 ISO-8859-1 转换为 UTF-8 ,由于 ISO-8859-1 是单字节编码,与 UTF-8 不同无法转换,需要先转换为 GBK。
在py3中encode,在转码的同时还会把string变成bytes类型,decode在解码的同时还会把bytes变回string
详细文章:点击此处