python不同字符编码之间的转换
python2默认编码是ASCII,一直到py2.7用的还是ASCII,导致Python只支持英文,想支持其他语言,必须单独配置。
当年在文件开头声明文件的编码才能写中文。如下:
# -*- coding:utf-8 -*-
如果电脑是windows系统,系统默认编码是GBK,声明的时候要声明成GBK,否则依然是乱码,一位内gbk不认识utf-8.
到了python3版本后,终于把默认编码改成了unicode,同时文件存储编码变成了utf-8。不用任何声明就可以写各种语言了。
常用编码介绍:
其中ASCII编码不支持中文。
unicode和任何编码都有映射关系。
gbk----unicode---utf8