摘要: 说在前面 和word的文本相比PDF更类似于一张张图片,图上放着一个个文字。对其的解析是将图片上的文字提取到text文件中,方便之后的分析。 添加依赖 在python的环境中安装PDFminer3k,不要装错了,一开始我装的是PDFminer,结果有几个包不能用 pip install pdfmin 阅读全文
posted @ 2021-06-19 11:12 酸奶面包 阅读(639) 评论(0) 推荐(0) 编辑