随笔 - 46  文章 - 22  评论 - 23  阅读 - 36万

HTML转PDF

Maven依赖

复制代码
<dependency>
    <groupId>com.itextpdf</groupId>
    <artifactId>itextpdf</artifactId>
    <version>5.5.7</version>
</dependency>
<dependency>
    <groupId>com.itextpdf.tool</groupId>
    <artifactId>xmlworker</artifactId>
    <version>5.5.7</version>
</dependency>
复制代码

类图及API

类图

IHtml2PdfService

HTML转PDF的服务接口

write (htmlContent: java.lang.String, os: java.io.OutputStream): void

将指定的html转换成pdf内容后,写到指定的输出流。

Html2PdfServiceImpl

HTML转PDF的服务实现类

write (htmlContent: java.lang.String, os: java.io.OutputStream): void

实现:将指定的html转换成pdf内容后,写到指定的输出流。

getIntaceHtml (htmlContent: String): String

私有方法,用于获取完整的html文档;如果传入的只是html片断,需要使用模板将其完整化。

doWrite (htmlContent: String, os: OutputStream): void

私有方法,将完整的html文档转换成pdf之后,写到指定的输出流。

代码

IHtml2PdfService

复制代码
package cn.ljl.javaweb.demo.ckeditor.service;

public interface IHtml2PdfService {
    /** html完整内容的前缀标识 */
    public static final String INTACT_FLAG = "<html>";
    
    /**
     * html模板,当待转换的html只是片断时,需将其插入到模板的body内.
     */
    public static final String TEMPLATE_HTML = 
            "<html>" +
            "    <head>" +
            "        <style type='text/css'>body {font-family: SimSun;}</style>" +
            "    </head>" +
            "    <body>" +
            "        ${content}" +
            "    </body>" +
            "</html>";
    
    /** 将指定的html内容转化成pdf文档之后,写入到指定的输出流. */
    public void write(java.lang.String htmlContent, java.io.OutputStream os);
    
}
复制代码

Html2PdfServiceImpl

复制代码
package cn.ljl.javaweb.demo.ckeditor.service;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.nio.charset.Charset;

import com.itextpdf.text.DocumentException;

public class Html2PdfServiceImpl implements IHtml2PdfService {
    @Override
    public void write(String htmlContent, OutputStream os) {
        if (htmlContent == null || htmlContent.length() == 0)
            return;

        if (os == null)
            return;

        htmlContent = getIntaceHtml(htmlContent);
        doWrite(htmlContent, os);
    }
    
    /**
     * 根据提供的html内容,获取完整的html内容.<br>
     * @param htmlContent
     * @return
     */
    private String getIntaceHtml(String htmlContent) {
        boolean intact = htmlContent.trim().toLowerCase()
                .startsWith(INTACT_FLAG);
        if (!intact) {
            htmlContent = TEMPLATE_HTML.replaceFirst("\\$\\{content\\}", htmlContent);
        }

        return htmlContent;
    }
    
    /**
     * 实施写操作.<br>
     * @param htmlContent
     * @param os
     */
    private void doWrite(String htmlContent, OutputStream os) {
        InputStream is = new ByteArrayInputStream(htmlContent.getBytes());

        com.itextpdf.text.Document document = new com.itextpdf.text.Document();
        com.itextpdf.text.pdf.PdfWriter writer = null;
        try {
            writer = com.itextpdf.text.pdf.PdfWriter
                    .getInstance(document, os);
            document.open();
            
            com.itextpdf.tool.xml.XMLWorkerHelper.getInstance().parseXHtml(writer,
                    document, is, Charset.forName("gbk"));
        } catch (DocumentException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        
        writer.flush();
        // ywjy HTML2PDF 如果我们调用writer.close(),可能无法正常的生成pdf,甚至会遇到
        // Exception:The page 1 was requested but the document has only 0 pages.
        // writer.close();
        document.close();
    }
}
复制代码

可能遇到的问题

1. 中文字符显示问题

如果是完整的html文档,需要使用css为整个文档设置一个默认的字体,如IHtml2PdfService的模板中的代码片段:

<style type='text/css'>body {font-family: SimSun;}</style>

2. 部分内容空白

可能是html文档使用了服务器中没有的字体。比如html文档的某个div,设置了仿宋字体,而机器上又没有安装,那么转换成pdf的时候,对应的内容是空白。

posted on   一尾金鱼  阅读(3281)  评论(0编辑  收藏  举报
编辑推荐:
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
· Linux系统下SQL Server数据库镜像配置全流程详解
阅读排行:
· Sdcb Chats 技术博客:数据库 ID 选型的曲折之路 - 从 Guid 到自增 ID,再到
· 语音处理 开源项目 EchoSharp
· 《HelloGitHub》第 106 期
· mysql8.0无备份通过idb文件恢复数据过程、idb文件修复和tablespace id不一致处
· 使用 Dify + LLM 构建精确任务处理应用
< 2025年1月 >
29 30 31 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1
2 3 4 5 6 7 8

点击右上角即可分享
微信分享提示