PaddleOCR的使用(C++)——Windows编译篇

PaddleOCR有文本检测(detection)和文本识别(recognition)两个阶段,其中文本检测算法选用DB,文本识别算法选用CRNN,并在检测和识别模块之间添加文本方向分类器,以应对不同方向的文本识别。

当前最新版本为PP-OCRv3,可调节参数含义参考PaddleOCR/readme_ch.md at release/2.6 · PaddlePaddle/PaddleOCR (github.com) (在网页靠后位置)。

测试了下,速度和准确率很棒,见下图:

 百度开源了飞桨系列产品,如下图。本篇研究下PaddleOCR。PaddleDetection类似YOLO用于定位,以后需要再研究。

本片主要罗列适合于Windows系统的下载项和注意点,具体编译参考官网教程(已经写的很具体,不再重复了)

官网编译教程:https://paddleinference.paddlepaddle.org.cn/user_guides/download_lib.html#windows

1、下载C++预测库

根据名称里的版本,下载对应的依赖库。

cuda11.6  下载地址 https://developer.nvidia.cn/cuda-toolkit-archive

cudnn8.4  下载地址 https://developer.nvidia.cn/rdp/cudnn-archive

TensorRT8.4.15  下载地址 https://developer.nvidia.com/nvidia-tensorrt-8x-download

PaddleOCR源码  下载地址 PaddlePaddle/PaddleOCR at dygraph (github.com) 注意是dygraph分支

OpenCV(我下载的最新版4.7.0)  下载地址 Releases - OpenCV

2、以上就下载齐全了,下面解压与安装

CUDA会自动安装在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA

其他的都解压到自建的文件夹中(为了方便找到我放一起了,而且不要带版本号的文件夹,直接剪切里面的到自定义的文件夹里),如下图

3、编译出sln

路径与勾选已用红框标出:

4、预测

下载模型  PaddlePaddle/PaddleOCR at dygraph (github.com)

解压后依然放到自定义文件夹下

cmd执行exe进行预测

CHCP 65001
.\build\Release\ppocr.exe system --det_model_dir=C:\Paddle\model\ch_PP-OCRv3_det_infer --rec_model_dir=C:\Paddle\model\ch_PP-OCRv3_rec_infer --image_dir=C:\Paddle\PaddleOCR-dygraph\doc\imgs\11.jpg

 

posted @ 2023-03-15 14:55  夕西行  阅读(1728)  评论(0编辑  收藏  举报