python实现图片提取文字功能

安装需要的包
# pip install pytesseract
# pip install Pillow
# 安装OCR环境
# 下载exe安装文件
# https://digi.bib.uni-mannheim.de/tesseract/
# 下载需要的版本,安装时下载需要的语言
# 安装完成后添加全局环境遍历 path 
核心代码如下
复制代码
from PIL import Image
import io
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'安装OCR的地址\\tesseract.exe'
#img 为Image图片
#lan为获取的语言
#
pytesseract.get_languages(config='') 获取下载的所有语言
#这里拼接了所有语言
try: 
ling
= pytesseract.get_languages(config='')
lan
=''
for k in ling:
lan
=f'{lan}+{k}'
text
= pytesseract.image_to_string(img, lang=lan)

return text

except :

raise Exception("错误信息!")
复制代码

如有好的方法还请多多指教

posted @   HoFei1113  阅读(170)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)
点击右上角即可分享
微信分享提示