paddleXOCR c++ vs2022编译以及使用

合集 - OCR(1)

1.paddleXOCR c++ vs2022编译以及使用2024-05-29

PaddleOCR的使用（C++)——Windows编译篇 - 夕西行 - 博客园 (cnblogs.com) 参考

官方的指导地址，按照他的来很全

PaddleOCR/deploy/cpp_infer/docs/windows_vs2019_build.md at main · PaddlePaddle/PaddleOCR · GitHub

1.opencv 我这里用的4.4（高版本应该也可以）

Releases - OpenCV

2.cmake 3.29.3 （低版本可能不支持2022）

Download CMake

3.vs 2022/2019

下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux (microsoft.com)

4.paddle_infer

https://paddleinference.paddlepaddle.org.cn/user_guides/download_lib.html#windows

框选部分为CPU预测

5.模型下载：需求2种模型

1.文字检测：是OCR系统中的关键步骤，旨在从图像中定位并分割出文字区域。

2.文字识别：是将检测到的文字区域转换为可编辑的文本格式的过程。

PP-OCRv3_基础模型_OCR_文字检测-飞桨AI Studio星河社区 (baidu.com)

开始编译：

1.下载paddleOCR源码

https://github.com/PaddlePaddle/PaddleOCR.git

2.cmake 配置生成vs项目（我这里没有用GPU，所以没下载CUDA等内容）

1）找到cpp源码位置如下图配置源码路径（source code），添加项目生成路径；点击配置（configure），失败

2）依赖库路径（opencv，paddle_infer前面准备的），点击配置（configure）依旧失败的话修改

deploy\cpp_infer\external-cmake\auto-log.cmake 中

GIT_REPOSITORY https://gitee.com/Double_V/AutoLog

3)再次configure,完成，generate 生成VS项目

3.打开生成项目 ppocr.sln,将生成目标改为x64 Release

5.生成完成

6.使用

程序运行需求DLL如图，img内存放要识别的图

图1 这是之前旧版的说明书，把人搞蒙的，还是得看官方文档

图2

识别指令：

ppocr.exe system --det_model_dir=C:\gitCode\paddle\deploy\cpp_infer\build2\Release\ch_PP-OCRv3_det_infer --rec_model_dir=C:\gitCode\paddle\deploy\cpp_infer\build2\Release\ch_PP-OCRv3_rec_slim_infer --image_dir=C:\gitCode\paddle\deploy\cpp_infer\build2\Release\img

注意上面的两个模型分别为ch_PP-OCRv3_det_infer 文字位置检测；ch_PP-OCRv3_rec_slim_infer文字识别

识别结果：