Python PDF文件怎么转换成Word?

一、演示

Python PDF转Word演示效果 (文件比较大处理比较慢):

 

二、源代码

#!/usr/bin/python
# -*- coding: UTF-8 -*-
"""
@author:HUI
@file:test.py
@time:2022/11/18
"""

import win32com.client
import os

# 输入输出路径
pdf_path = r"""D:\ProgramData\test\Input.pdf"""
output_path = r"""D:\ProgramData\test"""

word = win32com.client.Dispatch("Word.Application")
word.visible = 0  # 如果希望看到WORD应用程序正在运行,并且WORD显示所有消息或警告,请更改为1

# 获取文件名和输出路径
filename = pdf_path.split('\\')[-1]
in_file = os.path.abspath(pdf_path)

# 将PDF转换为DOCX,并将其保存在具有相同输入文件名的输出路径上
wb = word.Documents.Open(in_file)
out_file = os.path.abspath(output_path + '\\' + filename[0:-4] + ".docx")
wb.SaveAs2(out_file, FileFormat=16)
wb.Close()
word.Quit()
posted @ 2022-11-18 14:25  Hlikex  阅读(676)  评论(0编辑  收藏  举报