python开发简易pdf阅读器,没开发,换个思路:pdf转word文档
---初学python---
最近发现电脑里的pdf文件用浏览器全都打不开了,所以想到最近新学了python,为何不自己做一个呢?
准备环境:
-
Python3.7
-
PyMuPDF
-
PyQt5
首先安装 PyMuPDF 来解析 PDF ,如图:
安装PyQt5 ,做视图操作文件:
阅读器还没做,哈哈哈,但是最近想着直接转换成word文档不就好了吗,哈哈哈,就几行代码,如下:
from pdfminer.high_level import extract_pages from pdfminer.layout import LTTextContainer from docx import Document #先创建doc对象 doc = Document() # 以默认模板建立文档对象 #将pdf内容转换成文字 for page_layout in extract_pages("test.pdf"): for element in page_layout: if isinstance(element, LTTextContainer): print(element.get_text()) #写入内容 paragraph = doc.add_paragraph(element.get_text()) #最关键的一步,保存文档 doc.save('test.docx')
What do you want to be?
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步