paddleXOCR c++ vs2022编译以及使用

PaddleOCR的使用(C++)——Windows编译篇 - 夕西行 - 博客园 (cnblogs.com) 参考

官方的指导地址,按照他的来很全

PaddleOCR/deploy/cpp_infer/docs/windows_vs2019_build.md at main · PaddlePaddle/PaddleOCR · GitHub

1.opencv 我这里用的4.4(高版本应该也可以)

Releases - OpenCV

2.cmake 3.29.3 (低版本可能不支持2022)

Download CMake

3.vs 2022/2019

下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux (microsoft.com)

4.paddle_infer

https://paddleinference.paddlepaddle.org.cn/user_guides/download_lib.html#windows

 框选部分为CPU预测

 

5.模型下载:需求2种模型

1.文字检测:是OCR系统中的关键步骤,旨在从图像中定位并分割出文字区域。

2.文字识别:是将检测到的文字区域转换为可编辑的文本格式的过程。

PP-OCRv3_基础模型_OCR_文字检测-飞桨AI Studio星河社区 (baidu.com)

 

开始编译:

1.下载paddleOCR源码

https://github.com/PaddlePaddle/PaddleOCR.git

2.cmake 配置 生成vs项目 (我这里没有用GPU,所以没下载CUDA等内容)

 1)找到cpp源码位置 如下图配置源码路径(source code),添加项目生成路径;点击配置(configure),失败

2)依赖库路径(opencv,paddle_infer前面准备的),点击配置(configure) 依旧失败的话 修改

deploy\cpp_infer\external-cmake\auto-log.cmake  中

GIT_REPOSITORY https://gitee.com/Double_V/AutoLog 

 

3)再次configure,完成,generate 生成VS项目

3.打开生成项目 ppocr.sln,将生成目标改为x64 Release

 

 5.生成完成

 

6.使用

 程序运行需求DLL如图,img内存放要识别的图

图1 这是之前旧版的说明书,把人搞蒙的,还是得看官方文档

 图2

 

识别指令:

ppocr.exe system --det_model_dir=C:\gitCode\paddle\deploy\cpp_infer\build2\Release\ch_PP-OCRv3_det_infer --rec_model_dir=C:\gitCode\paddle\deploy\cpp_infer\build2\Release\ch_PP-OCRv3_rec_slim_infer --image_dir=C:\gitCode\paddle\deploy\cpp_infer\build2\Release\img

注意上面的两个模型分别为ch_PP-OCRv3_det_infer 文字位置检测  ;ch_PP-OCRv3_rec_slim_infer文字识别

识别结果:

 

posted @ 2024-05-29 22:57  BangZeng  阅读(76)  评论(0编辑  收藏  举报