刚开始使用Code::Blocks开发Windows中文应用程序的朋友们,如果在代码中使用了中文字符串,编译时可能遇到过Illegal byte sequence或Failure to convert GBK to UTF-8这样的错误提示。这类错误的原因在于源代码文件编码和编译器编码设置不一致造成的。

  1. Code::Blocks 编辑器保存源文件用的编码。

    默认情况下,是保存为windows本地编码的,也就是WINDOWS-936字符集,也就是GBK编码。但是GCC编译器默认编译的时候是按照UTF-8解析的(linux默认字符集是UTF-8),如果没有声明编码格式,编译器会把GBK当成UTF-8解析,从而导致编译错误。编译时报错:
    error: converting to execution character set: Illegal byte sequence.

    其实要解决这个问题很简单,编写Code::Blocks的人只需要在调用编译器之前检测一下源文件是什么编码,然后就自动让编译器用什么编码进行解释,问题就解决了。只是很可惜,Code::Blocks编写的人可能还没有这么做,或许是对本地化认识不够吧,也可能是觉得没必要吧?(所以就给初学的人带来问题了,所以就觉得易用性不如微软了,免费和商业的东西还是有差距的。。。)

    通常情况下,只要在Code::Blocks(13.12)中将源代码文件保存为UTF-8格式,就可以消除上述错误。操作方法是在源代码文件窗口激活的情况下,通过在编辑(Edit)菜单下的文件编码(Encoding)子菜单中选择BOM和UTF-8,然后保存并编译源文件。
    image
  2. GCC编译器编译的时候对输入的源文件解释用的编码

    GCC编译器可以通过-finput-charset=charset设置来指定编译器用什么编码解释输入源文件。比如源文件的字符集是GBK,那么就必须指定-finput-charset=GBK,如果不指定,一律当做UTF-8处理,这时如果源文件编码不是UTF-8,编译时就会出现编码转换错误。
    在Code::Blocks 13中也可以进入设置菜单打开编辑器设置对话框,在常规设置的“其它”页面中修改这一编码(如下图)。
    image
  3. 编译可执行文件所用编码

    如果源代码文件和编译器输入设置的编码是一致的,编译时就不会报错了,但是编译后运行时,在控制台显示的依然是乱码!
    那是因为控制台显示的时候缺省的是使用系统默认的字符集,比如windows下用的是GBK,但是默认情况下,编译之后的执行文件时编译成UTF-8的,所以又出现了不统一,乱码由此而生!
    要解决这一问题,需要在CodeBlocks的编译器设置。进入设置菜单打开编译器设置对话框,选择编译器设置的其它选项页面(如下图),添加选项:-fexec-charset=GBK。image
    重新编译后,应用程序就可以正常运行了。