Python 在同一/或不同PDF之间复制页面
操作PDF文档时,复制其中的指定页面可以帮助我们从PDF文件中提取特定信息,如文本、图表或数据等,以便在其他文档中使用。复制PDF页面也可以实现在不同文件中提取页面,以创建一个新的综合文档。本文将介绍如何使用Python 在同一文档中复制PDF页面,或者复制页面到另一PDF文档中。
所需Python库 - Spire.PDF for Python。可以通过下面的pip命令直接安装:
pip install Spire.Pdf
Python 在同一PDF 文档中复制页面
Spire.PDF for Python库支持在文档中添加新页面,然后将指定页面的内容绘制到新页面来实现复制PDF页面。操作如下:
- 使用 LoadFromFile() 方法加载PDF文档;
- 获取文档中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
- 通过 Insert() 方法在指定索引处插入空白新页面 (也可以使用 Add() 方法直接在文档末尾添加新页面);
- 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
- 使用 SaveToFile() 方法保存PDF文档。
from spire.pdf.common import * from spire.pdf import * # 加载PDF文档 pdf = PdfDocument() pdf.LoadFromFile("实验.pdf") # 获取第一页 page = pdf.Pages[0] # 基于该页面创建模板 template = page.CreateTemplate() # 插入一个新页面到第二位置处 page = pdf.Pages.Insert(1, page.Size, PdfMargins(0.0)) # 将模板绘制到新页面上 page.Canvas.DrawTemplate(template, PointF(0.0, 0.0)) # 保存PDF pdf.SaveToFile("复制PDF页面.pdf"); pdf.Close()
Python在不同PDF 文档之间复制页面
也可以将指定页面从一个PDF文档复制到另一个PDF文档中,具体操作如下:
- 使用 LoadFromFile() 方法加载两个PDF文档;
- 获取文档1中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
- 通过 Insert() 方法在文档2中指定索引处插入空白新页面;
- 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
- 使用 SaveToFile() 方法保存结果文档
from spire.pdf.common import * from spire.pdf import * # 加载文档1 pdf1 = PdfDocument() pdf1.LoadFromFile("实验.pdf") # 加载文档2 pdf2 = PdfDocument() pdf2.LoadFromFile("南极洲.pdf") # 获取文档1中的第一页 page = pdf1.Pages[0] # 基于该页面内容创建模板 template = page.CreateTemplate() # 在文档2指定位置处插入空白新页面 newPage = pdf2.Pages.Insert(0, page.Size, PdfMargins(0.0)) # 将模板绘制到新页面上 newPage.Canvas.DrawTemplate(template, PointF(0.0, 0.0)) # 保存PDF pdf2.SaveToFile("复制页面到另一PDF.pdf") pdf2.Close()
生成文档中的红色水印,可以通过点击以下链接,申请一个月免费授权来去除:
https://www.e-iceblue.cn/misc/temporary-license.html