python实现图片提取文字功能

安装需要的包

# pip install pytesseract

# pip install Pillow

# 安装OCR环境

# 下载exe安装文件

# https://digi.bib.uni-mannheim.de/tesseract/

# 下载需要的版本,安装时下载需要的语言

# 安装完成后添加全局环境遍历 path

核心代码如下

from PIL import Image
import io
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'安装OCR的地址\\tesseract.exe'
#img 为Image图片
#lan为获取的语言
#pytesseract.get_languages(config='') 获取下载的所有语言
#这里拼接了所有语言

try: 
ling= pytesseract.get_languages(config='') 
lan='' 
for k in ling: 
lan=f'{lan}+{k}' 
text = pytesseract.image_to_string(img, lang=lan) 

return text 

except : 

raise Exception("错误信息!")

如有好的方法还请多多指教

posted @ 2023-08-29 15:57 HoFei1113 阅读(202) 评论(0) 收藏举报

刷新页面返回顶部

HoFei

python实现图片提取文字功能

公告