字符编码的转换
字符编码的转换
编码转换是指将一种编码转成另一种编码,比如utf-8转成gbk。
为什么需要编码转换?因为不同操作系统编码不同,utf-8在win上没法直接看,因为windows是gbk编码的,需要转成gbk才行。如果你的bgk字符想在Linux/Mac上正常显示,就得转成utf-8.
一、编码&解码
s = '小明'
a = s.encode('utf-8')
print(a)
b = a.decode('utf-8')
print(b)
在python3中,内存里的字符是以unicode编码的,unicode的其中一个特性就是跟所有语言编码都有映射关系。所以你的utf-8格式的文件,在windows电脑若是不能看,就可以把utf-8先解码成unicode,再由unicode编码成gbk就可以了。
注:不管在windows、Mac还是Linux上,你的pycharm IDE都可以支持各种文件编码,所以即使是utf-8的文件,在windows下的pycharm里也可以正常显示。