编码的转换
编码转换是指将一种编码转成另外一种编码,比如 utf-8 to gbk。
为何需要编码转换呢? 因为不同操作系统编码不同, utf-8在win上没办法直接看,因为windows是GBK编码的,得转成gbk。 反过来如果你的GBK字符相在Linux\Mac上正常显示,就得转成utf-8编码。
编码与解码
s.encode("utf-8") #以utf-8编码成2进制
s.decode("utf-8") #以utf-8解码成unicode str
1 s = "你好未来" 2 3 s_utf8 = s.encode("utf-8") 4 5 s_utf8.decode("utf-8") #如果括号内不写的话系统会默认用py3里面的Utf-8
编码转换
把文字从一种编码转化成另外一种,例如从utf-8转为gbk
gbk------》 unicode 》utf-8
unicode:万国码,跟所有的编码之间都有映射关系
1 原本这个 win_data.txt文件是gbk编码的,现在转换为utf-8编码 2 3 f = open("win_data.txt","rb") 4 5 s = f.read() 6 7 f.close() 8 9 s_unicode = s.decode("gbk") #把gbk解码成为unicode,转为unicode 10 11 s_utf8 = s_unicode.encode("utf_8") 12 13 f = open("win_data.txt","wb") 14 15 f.write(s_utf8) 16 17 f.close()