编码的转换

编码转换是指将一种编码转成另外一种编码,比如 utf-8 to gbk。

为何需要编码转换呢? 因为不同操作系统编码不同, utf-8在win上没办法直接看,因为windows是GBK编码的,得转成gbk。 反过来如果你的GBK字符相在Linux\Mac上正常显示,就得转成utf-8编码。

 

编码与解码

   s.encode("utf-8")  #以utf-8编码成2进制

   s.decode("utf-8")  #以utf-8解码成unicode str

 

1 s = "你好未来"
2  
3 s_utf8 = s.encode("utf-8")
4  
5 s_utf8.decode("utf-8")  #如果括号内不写的话系统会默认用py3里面的Utf-8

 

编码转换

把文字从一种编码转化成另外一种,例如从utf-8转为gbk

gbk------》  unicode  》utf-8

unicode:万国码,跟所有的编码之间都有映射关系

 1 原本这个 win_data.txt文件是gbk编码的,现在转换为utf-8编码
 2 
 3 f = open("win_data.txt","rb")
 4 
 5 s = f.read()
 6 
 7 f.close()
 8 
 9 s_unicode = s.decode("gbk")  #把gbk解码成为unicode,转为unicode
10 
11 s_utf8 = s_unicode.encode("utf_8")
12 
13 f = open("win_data.txt","wb")
14 
15 f.write(s_utf8)
16 
17 f.close()

 

 

posted @ 2019-11-14 00:21  进击的小吴  阅读(636)  评论(0编辑  收藏  举报