搭建本地OCR服务(Paddlepaddle)

1. 先安装conda软件并创建conda虚拟环境指定好python版本

   下载conda:https://www.anaconda.com/download/ 安装并配置好环境变量

    创建虚拟环境:conda create --name ocr python=3.8

2. 安装paddlepaddle

    下载paddlepaddle https://www.paddlepaddle.org.cn/  根据设备情况安装 cpu 版本 / gpu 版本

3. 安装paddlehub (paddlehub 与 paddlepaddle 版本要兼容)目前用的 2.4.0

    在激活第一步创建好的虚拟环境下进行安装 pip install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple

    2.4.0下的numpy会有个版本问题 尝试先卸载掉当前环境下的的numpy(pip uninstall numpy)然后在安装 pip install numpy==1.23.4 -i https://pypi.tuna.tsinghua.edu.cn/simple/

4. 启动服务

  hub serving start -m chinese_ocr_db_crnn_mobile 或 hub serving start -m chinese_ocr_db_crnn_server 启动后可以用apifox进行测试

测试接口:http://localhost:8866/perdict/chinese_ocr_db_crnn_mobile

说明:

chinese_ocr_db_crnn_mobile 模型移动端轻量模型 (识别速度快,精度低)

chinese_ocr_db_crnn_server 服务器端高精度模型 (识别速度慢,精度高)

-----------------下面是源码安装服务-------------

5. 下载源码

  git clone https://github.com/PaddlePaddle/PaddleOCR.git

6. 下载模型 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/models_list.md 到 /inference/
  ch_PP-OCRv2_rec
  ch_ppocr_server_v2.0_rec
  在PaddleOCR\deploy\hubserving\ocr_rec\params.py文件的cfg.rec_model_dir配置项修改为上述下载的模型文件路径"./inference/ch_PP-OCRv2_rec_infer/"

7.安装服务
  安装文字识别服务:
  hub install deploy\hubserving\ocr_rec
  安装文字检测服务:
  hub install deploy\hubserving\ocr_det
  安装串联检测识别服务:
  hub install deploy\hubserving\ocr_system

 8.代码启动
 import paddlehub as hub
 ocr = hub.Module(name="chinese_ocr_db_crnn_server")

 9. 启动服务
 启动串联服务:
 windows:
 hub serving start -m ocr_system
 linux:
 nohup hub serving start -m ocr_system &

 

    

 

posted @ 2024-09-20 15:03  索一零  阅读(11)  评论(0编辑  收藏  举报