java 多页pdf转化为多张图片

相关jar包:

		<dependency>
			<groupId>com.itextpdf</groupId>
			<artifactId>itext-asian</artifactId>
			<version>5.2.0</version>
		</dependency>
		<dependency>
			<groupId>org.apache.pdfbox</groupId>
			<artifactId>pdfbox</artifactId>
			<version>2.0.0</version>
		</dependency>
		<dependency>
			<groupId>org.apache.pdfbox</groupId>
			<artifactId>fontbox</artifactId>
			<version>2.0.0</version>
		</dependency>
		<dependency>
			<groupId>com.itextpdf</groupId>
			<artifactId>itextpdf</artifactId>
			<version>5.5.13</version>
		</dependency>

相关代码:

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.ImageType;
import org.apache.pdfbox.rendering.PDFRenderer;
import java.util.UUID;

import javax.imageio.ImageIO;
import java.awt.*;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

	/**
	 * 	 将多页pdf转化为多张图片
	 * @param pdfPath 表示pdf的路径
	 * @return 转化后的图片的路径集合
	 * @throws IOException
	 */
	public static List<String> pdfPathToImagePaths(String pdfPath) throws IOException {
		log.info("将多页pdf转化为图片,pdf路径为:"+pdfPath);
		File pdfFile = new File(pdfPath);
		PDDocument pdDocument = PDDocument.load(pdfFile);
		int pageCount = pdDocument.getNumberOfPages();
		PDFRenderer pdfRenderer = new PDFRenderer(pdDocument);
		List<String> imagePathList=new ArrayList<>();
		String fileParent = pdfFile.getParent();
		for (int pageIndex=0; pageIndex<pageCount; pageIndex++) {
			String imgPath = fileParent + File.separator +UUID.randomUUID().toString()+".png";
			BufferedImage image = pdfRenderer.renderImageWithDPI(pageIndex, 105, ImageType.RGB);
			ImageIO.write(image, "png", new File(imgPath));
			imagePathList.add(imgPath);
			log.info("第{}张生成的图片路径为:{}",pageIndex,imgPath);
		}
		pdDocument.close();
		return imagePathList;
	}

这里的UUID.randomUUID()是产生一个随机的32位数字字母,作为文件名。
也可以自己去找些工具类,或者改用具体的时间作为文件名。

参考资料:
https://blog.csdn.net/u013405574/article/details/51086186

posted on   乐之者v  阅读(3774)  评论(0编辑  收藏  举报

编辑推荐:
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· 2 本地部署DeepSeek模型构建本地知识库+联网搜索详细步骤
< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

导航

统计

点击右上角即可分享
微信分享提示