tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题

编译tesseract - ocr时 各种不通过 也很疑惑,完全按照官方指导来的啊

首先以为是vs的编码问题,随切换选项-切换Unicode或多编码字符集,但仍无效。

定位到乱码的文件,用notepad++ 打开,查看编码,是“”“以UTF-8无BOM格式编码”,切换成utf-8编码,将所有有中文的编码都切换了(还好只有两个),然后编译既然成功了。

然后新建了一个工程,一路默认创建。打开默认创建的cpp文件,是ANSI编码,没有任何文件头信息。可能是vs对于无bom的utf8不认识吧,默认把它当成了ANSI编码,所以造成这个问题。

看到一篇博客说vs2008,创建的C++源文件的缺省编码方式为CP936,即GB2312

 

posted @   愤怒的企鹅  阅读(1052)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
点击右上角即可分享
微信分享提示