会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
谷小雨
博客园
首页
新随笔
联系
订阅
管理
2024年6月17日
内网编译安装tesseract用于OCR识别
摘要: 需求:使用unstructured模块进行pdf内容识别及分块,需要本地安装了tesseract-ocr,以支持pytesseract * 在Windows,可以直接安装tesseract-ocr;在Ubuntu,可以用apt install tesseract-ocr安装相关环境及依赖 当安装源里
阅读全文
posted @ 2024-06-17 16:51 谷小雨
阅读(70)
评论(0)
推荐(0)
编辑
公告