python实现图片提取文字功能

安装需要的包
# pip install pytesseract
# pip install Pillow
# 安装OCR环境
# 下载exe安装文件
# https://digi.bib.uni-mannheim.de/tesseract/
# 下载需要的版本,安装时下载需要的语言
# 安装完成后添加全局环境遍历 path 
核心代码如下
from PIL import Image
import io
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'安装OCR的地址\\tesseract.exe'
#img 为Image图片
#lan为获取的语言
#
pytesseract.get_languages(config='') 获取下载的所有语言
#这里拼接了所有语言
try: 
ling
= pytesseract.get_languages(config='')
lan
=''
for k in ling:
lan
=f'{lan}+{k}'
text
= pytesseract.image_to_string(img, lang=lan)

return text

except :

raise Exception("错误信息!")

如有好的方法还请多多指教

posted @ 2023-08-29 15:57  HoFei1113  阅读(155)  评论(0编辑  收藏  举报