paddle ocr离线ocr识别python测试
百度paddle ocr是非常不错的深度学习平台 中文识别效果很好 接近收费的百度ocr 参考这几个文章 如何在Windows上一键部署PaddleOCR的WebAPI服务 - 明月心技术学堂 - 博客园 (cnblogs.com)
https://mp.weixin.qq.com/s/zxvfA6EUzrcvDX3v8cPD6w
https://mp.weixin.qq.com/s/zxvfA6EUzrcvDX3v8cPD6w
PaddleOCR/whl.md at release/2.6 · PaddlePaddle/PaddleOCR · GitHub
使用过程
0。第一步,要安装Python环境。下载地址:https://www.python.org/downloads/ 建议安装3.9版本 必须是x64板。我试过3.6x32版本 3.11 都需要更复杂的操作
1.把pip源改成国内源 加速pip下载速度,把下面的文本内容,保存为pip.ini文件,存放到你的python安装目录下,例如:C:\Users\username\AppData\Local\Programs\Python\Python39
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
2.在cmd或者powershell里运行
升级pip
python -m pip install --upgrade pip
安装paddlepaddle 这里是cpu版 Intelcpu 开启mkldnn加速也挺快的 gpu最快
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
安装ocr
pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本
可能会有一些wheel装不上,缺哪个就下载wheel 要不然就会编译源码,一般的电脑就没有c++14
Archived: Python Extension Packages for Windows - Christoph Gohlke (uci.edu)
运行下边脚本 ,选择图片 就可以看到识别结果
from tkinter import filedialog from paddleocr import PaddleOCR, draw_ocr FilePath = filedialog.askopenfilename() # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换 # 例如`ch`, `en`, `fr`, `german`, `korean`, `japan` ocr = PaddleOCR(use_angle_cls=True, lang="ch",enable_mkldnn=True) # need to run only once to download and load model into memory,enable_mkldnn在intel处理器上开启后可以提高速度 result = ocr.ocr(FilePath, cls=True) print(result) # for line in result: # print(line) # 显示结果 from PIL import Image image = Image.open(FilePath).convert('RGB') boxes = [detection[0] for line in result for detection in line] # Nested loop added txts = [detection[1][0] for line in result for detection in line] # Nested loop added scores = [detection[1][1] for line in result for detection in line] # Nested loop added im_show = draw_ocr(image, boxes, txts, scores, font_path='./fonts/simfang.ttf') im_show = Image.fromarray(im_show) im_show.save('test.jpg') im_show.show()
识别结果可以