搭建本地OCR服务(Paddlepaddle)

1. 先安装conda软件并创建conda虚拟环境指定好python版本

下载conda：https://www.anaconda.com/download/ 安装并配置好环境变量

创建虚拟环境：conda create --name ocr python=3.8

2. 安装paddlepaddle

下载paddlepaddle https://www.paddlepaddle.org.cn/ 根据设备情况安装 cpu 版本 / gpu 版本

3. 安装paddlehub （paddlehub 与 paddlepaddle 版本要兼容）目前用的 2.4.0

在激活第一步创建好的虚拟环境下进行安装 pip install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple

2.4.0下的numpy会有个版本问题尝试先卸载掉当前环境下的的numpy（pip uninstall numpy）然后在安装 pip install numpy==1.23.4 -i https://pypi.tuna.tsinghua.edu.cn/simple/

4. 启动服务

hub serving start -m chinese_ocr_db_crnn_mobile 或 hub serving start -m chinese_ocr_db_crnn_server 启动后可以用apifox进行测试

测试接口：http://localhost:8866/perdict/chinese_ocr_db_crnn_mobile

说明：

chinese_ocr_db_crnn_mobile 模型移动端轻量模型（识别速度快，精度低）

chinese_ocr_db_crnn_server 服务器端高精度模型（识别速度慢，精度高）

-----------------下面是源码安装服务-------------

5. 下载源码

git clone https://github.com/PaddlePaddle/PaddleOCR.git

6. 下载模型 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/models_list.md 到 /inference/
ch_PP-OCRv2_rec
ch_ppocr_server_v2.0_rec
在PaddleOCR\deploy\hubserving\ocr_rec\params.py文件的cfg.rec_model_dir配置项修改为上述下载的模型文件路径"./inference/ch_PP-OCRv2_rec_infer/"

7.安装服务
安装文字识别服务：
hub install deploy\hubserving\ocr_rec
安装文字检测服务：
hub install deploy\hubserving\ocr_det
安装串联检测识别服务：
hub install deploy\hubserving\ocr_system

8.代码启动
import paddlehub as hub
ocr = hub.Module(name="chinese_ocr_db_crnn_server")

9. 启动服务
启动串联服务：
windows:
hub serving start -m ocr_system
linux:
nohup hub serving start -m ocr_system &

posted @ 2024-09-20 15:03 索一零阅读(977) 评论(0) 收藏举报

刷新页面返回顶部

suoyiling

搭建本地OCR服务(Paddlepaddle)

公告