paddleocr图片文字识别

介绍:PaddleOCR是由百度开发的一个OCR库,基于深度学习框架PaddlePaddle。PaddleOCR支持多语言文本识别,特别适合中文场景,同时它还提供了丰富的预训练模型。

1、安装

1
2
pip3 install paddlepaddle
pip3 install paddleocr

2、使用

1
2
3
4
5
6
7
8
9
10
11
12
13
from paddleocr import PaddleOCR
 
def paddle_image():
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    # 读取图像
    results = ocr.ocr(image_path, cls=True)
    # for (bbox, text) in results[0]: print(f"{text}")
    # 打印识别结果
    for line in results:
        for word_info in line:
            print(f"Detected text: {word_info[1][0]}, Confidence: {word_info[1][1]:.2f}")
 
paddle_image()

3、注意事项

3.1、windows使用时报错pyclipper模块init文件中ImpoerError:DLL load failed:找不到指定的模块。

  动态链接库 (DLL), 下载并安装 Microsoft Visual C++ Redistributable。https://learn.microsoft.com/en-us/cpp/windows/latest-supported-vc-redist?view=msvc-170

• 选择与你的 Python 版本匹配的版本(x86 或 x64)。

3.2、未联网环境复制下C:\Users\zhouman02\.paddleocr\whl

联网自动安装:

download https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_infer.tar to C:\Users\zhouman02/.paddleocr/whl\det\ch\ch_PP-OCRv4_det_infer\ch_PP-OCRv4_det_infer.tar
100%|██████████| 4.89M/4.89M [00:06<00:00, 758kiB/s]
download https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_infer.tar to C:\Users\zhouman02/.paddleocr/whl\rec\ch\ch_PP-OCRv4_rec_infer\ch_PP-OCRv4_rec_infer.tar
100%|██████████| 11.0M/11.0M [00:05<00:00, 2.19MiB/s]
download https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar to C:\Users\zhouman02/.paddleocr/whl\cls\ch_ppocr_mobile_v2.0_cls_infer\ch_ppocr_mobile_v2.0_cls_infer.tar
100%|██████████| 2.19M/2.19M [00:03<00:00, 658kiB/s]

3.3、报错ModuleNotFoundError: No module named ‘paddle’

  paddlepaddle未安装时会报该错误,安装后import paddle则不会报错

 

posted @   zmm521  阅读(52)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
点击右上角即可分享
微信分享提示