tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题

编译tesseract - ocr时各种不通过也很疑惑，完全按照官方指导来的啊

首先以为是vs的编码问题，随切换选项-切换Unicode或多编码字符集，但仍无效。

定位到乱码的文件，用notepad++ 打开，查看编码，是“”“以UTF-8无BOM格式编码”，切换成utf-8编码，将所有有中文的编码都切换了（还好只有两个），然后编译既然成功了。

然后新建了一个工程，一路默认创建。打开默认创建的cpp文件，是ANSI编码，没有任何文件头信息。可能是vs对于无bom的utf8不认识吧，默认把它当成了ANSI编码，所以造成这个问题。

看到一篇博客说vs2008，创建的C++源文件的缺省编码方式为CP936，即GB2312

posted @ 2017-11-09 22:45 愤怒的企鹅阅读(1104) 评论(0) 收藏举报

刷新页面返回顶部

tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题