会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
蓝莓薄荷
博客园
首页
新随笔
联系
订阅
管理
2021年8月24日
Python提取PDF文本数据
摘要: 很多文件为了安全都会存成pdf格式,如论文、技术文档、书籍等,而通过程序从pdf文档中提取对应的文本内容比较麻烦。在Python中,用于解析pdf文件的扩展包有很多,常用的有pdfminer3k、PyPDF2、Camelot、pdfplumber等。本文主要介绍如何使用pdfplumber库来解析pdf文件。
阅读全文
posted @ 2021-08-24 18:34 蓝莓薄荷
阅读(2978)
评论(0)
推荐(0)
编辑
公告