python2.7、notepad++及sublime text3中文乱码
问题:使用notepad++或sublime text3编辑的python文件如果含有中文,使用python2.7运行会出现乱码。
原因:
windows的本地默认编码是gbk编码。
notepad++、windows本身的写字板以及sublime text3的默认编码都是utf-8。
windows记事本的默认编码是ANSI。ANSI并不是某一种特定的字符编码,而是在不同的系统中,ANSI表示不同的编码。在中文系统中就是gbk编码。
这就是为什么用记事本编辑的python文件,用python2.7运行中文不会出现乱码。而用notepad++、windows本身的写字板以及sublime text3编辑的python文件,用python2.7运行中文会出现乱码的原因。
解决方法:
一、通过将中文先解码(解码成unicode码)再编码(编码成gbk)的方式解决,如下:
# coding=utf-8 # 等待用户输入 inp=raw_input("请输入用户名:".decode("utf-8").encode("gbk")) print inp
二、在编辑器中设置编码格式
备注:
那么Windows系统是如何区分ANSI背后的真实编码的呢?
微软用一个叫“Windows code pages”(在命令行下执行chcp命令可以查看当前code page的值)的值来判断系统默认编码,比如:简体中文的code page值为936(它表示GBK编码,win95之前表示GB2312,详见:Microsoft Windows' Code Page 936),繁体中文的code page值为950(表示Big-5编码)。