河北大学-徐小波

园龄：2年2个月粉丝：1 关注：4

python本地图片文字识别

1、首先需要安装tesseract-ocr

https://digi.bib.uni-mannheim.de/tesseract/

2、安装python所需模块

pip install pytesseract

3、下载语言包

https://github.com/tesseract-ocr/tessdoc/blob/main/Data-Files.md

下载后复制到 Tesseract-OCR\tessdata 目录

测试代码：

复制代码

#coding=utf-8

from PIL import Image
import pytesseract
#上面都是导包，只需要下面这一行就能实现图片文字识别，中文识别
text=pytesseract.image_to_string(Image.open('D:/workspace/pys/img/yingwen.jpg'),lang='eng')
print(text)

print("\n")
print('='*100)
print("\n")

#chi_tra
text=pytesseract.image_to_string(Image.open('D:/workspace/pys/img/hanzi.jpg'),lang='chi_sim')
print(text)

print("\n")
print('='*100)
print("\n")

#chi_tra
text=pytesseract.image_to_string(Image.open('D:/workspace/pys/img/hanzi.jpg'),lang='chi_tra')
print(text)

复制代码

运行效果：

遇到错误：

1、找不到Tesseract-OCR

\python38\Lib\site-packages\pytesseract\pytesseract.py

修改这行（指向之际安装Tesseract-OCR的文件）：

1	`tesseract_cmd =` `'D:/software/Tesseract-OCR/tesseract.exe'`

　　

2、提示找不到相应的语言包，参考（下载语言包）

上一篇转：Python实现高斯模糊

下一篇转：【重复图识别】在茫茫图海中，怎么找到相同的它？

posted @ 2023-02-15 16:22 河北大学-徐小波阅读(169) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

随笔：188
文章：0
评论：0
阅读：20523

公告

昵称：河北大学-徐小波
园龄： 2年2个月
粉丝： 1
关注： 4

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类 (233)