会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
酸奶面包
博客园
首页
新随笔
联系
订阅
管理
2021年6月19日
python解析PDF
摘要: 说在前面 和word的文本相比PDF更类似于一张张图片,图上放着一个个文字。对其的解析是将图片上的文字提取到text文件中,方便之后的分析。 添加依赖 在python的环境中安装PDFminer3k,不要装错了,一开始我装的是PDFminer,结果有几个包不能用 pip install pdfmin
阅读全文
posted @ 2021-06-19 11:12 酸奶面包
阅读(639)
评论(0)
推荐(0)
编辑
公告