paddle ocr离线ocr识别python测试

百度paddle  ocr是非常不错的深度学习平台   中文识别效果很好  接近收费的百度ocr   参考这几个文章   如何在Windows上一键部署PaddleOCR的WebAPI服务 - 明月心技术学堂 - 博客园 (cnblogs.com)

https://mp.weixin.qq.com/s/zxvfA6EUzrcvDX3v8cPD6w

 

https://mp.weixin.qq.com/s/zxvfA6EUzrcvDX3v8cPD6w

PaddleOCR/whl.md at release/2.6 · PaddlePaddle/PaddleOCR · GitHub

 

使用过程

0。第一步,要安装Python环境。下载地址:https://www.python.org/downloads/       建议安装3.9版本     必须是x64板。我试过3.6x32版本 3.11     都需要更复杂的操作

1.把pip源改成国内源 加速pip下载速度,把下面的文本内容,保存为pip.ini文件,存放到你的python安装目录下,例如:C:\Users\username\AppData\Local\Programs\Python\Python39


[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com

 

2.在cmd或者powershell里运行

升级pip

python -m pip install --upgrade pip

安装paddlepaddle    这里是cpu版    Intelcpu  开启mkldnn加速也挺快的   gpu最快

python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

安装ocr

pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本

可能会有一些wheel装不上,缺哪个就下载wheel    要不然就会编译源码,一般的电脑就没有c++14

Archived: Python Extension Packages for Windows - Christoph Gohlke (uci.edu)

 

运行下边脚本 ,选择图片  就可以看到识别结果

from tkinter import filedialog



from paddleocr import PaddleOCR, draw_ocr


FilePath = filedialog.askopenfilename()

# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch",enable_mkldnn=True)  # need to run only once to download and load model into memory,enable_mkldnn在intel处理器上开启后可以提高速度

result = ocr.ocr(FilePath, cls=True)
print(result)

# for line in result:
#     print(line)

# 显示结果



from PIL import Image
image = Image.open(FilePath).convert('RGB')
boxes = [detection[0] for line in result for detection in line] # Nested loop added
txts = [detection[1][0] for line in result for detection in line] # Nested loop added
scores = [detection[1][1] for line in result for detection in line] # Nested loop added
im_show = draw_ocr(image, boxes, txts, scores,  font_path='./fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('test.jpg')
im_show.show()

识别结果可以

 

 

 

 

 

 

 

 




posted @ 2022-10-19 11:17  kyo413  阅读(1970)  评论(1编辑  收藏  举报