【Python】PDF拆分、合并及其转换

1.拆分

复制代码
#import sys
#sys.path.append(r"c:\users\lenovo\appdata\local\programs\python\python312\lib\site-packages")  #这里包的安装目录不同,将其加入系统变量,目录相同不需要这个
from PyPDF3 import PdfFileWriter, PdfFileReader
input_pdf = PdfFileReader(r"F:\需要拆分的PDF文件.pdf") #使用 PdfFileReader 读取原始文件
output = PdfFileWriter()
#output.addPage(input_pdf.getPage(4)) #第x页,使用 PdfFileWriter 的 addPage() 方法将 PDF 页面添加到新的 PDF 中并保存
#output.addPage(input_pdf.getPage(30)) #可以添加多个页面
for i in range(15,16):#拆分第15-16页,从0开始计数
    output.addPage(input_pdf.getPage(i))  # 第x页,使用 PdfFileWriter 的 addPage() 方法将 PDF 页面添加到新的 PDF 中并保存

with open(r"保存拆分后的PDF文件.pdf", "wb") as out:
    output.write(out)
复制代码

2.合并

from PyPDF3 import PdfFileReader, PdfFileMerger
pdf_file1 = PdfFileReader(r"1.pdf") #第一页
pdf_file2 = PdfFileReader(r"2.pdf")#第二页
output = PdfFileMerger()
output.append(pdf_file1)
output.append(pdf_file2)
with open(r"3.pdf", "wb") as out:
    output.write(out)

 3.PDF转换成表格(扫描件不行)

#只能是转换的PDF,不能转换扫描件

import camelot

tables = camelot.read_pdf(r"需要转换的PDF文件.pdf",flavor='stream')

tables[0].to_csv(r"转化后存为csv表格.csv") #表格输出

 

posted @   山鬼谣`  阅读(18)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」
历史上的今天:
2024-01-15 【Python】去除列表中的重复元素而不改变其顺序
点击右上角即可分享
微信分享提示