摘要: 一、说在前面 0、还没系统学习,很迷茫,整体思路不明朗 1、完成了将pdf中的文字信息提取到txt,提取pdf中的前两级结构 2、下阶段完成从文本中抽取目标数据 3、所用包:pdfminer,PyPDF2 二、将pdf中的文字信息提取到txt(为抽取目标数据做准备) # _*_coding:utf- 阅读全文
posted @ 2021-06-10 21:40 程序那点事 阅读(291) 评论(0) 推荐(1) 编辑