会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
eliwang
学无止境的小渣渣
博客园
首页
新随笔
联系
订阅
管理
2022年2月18日
python如何提取pdf文件图片中的文字?
摘要: 思路:利用 pymupdf+pytesseract 通过pymupdf提取pdf文件中的图片,并写入到本地,然后利用tesseract-ocr去处理 1、安装pymupdf pip install pymupdf 虽然安装的库为pymupdf,实际上调用的包名为fitz 2、示例:提取pdf文件图片
阅读全文
posted @ 2022-02-18 18:01 eliwang
阅读(2860)
评论(0)
推荐(0)
编辑
公告