网页(HTML)转换为PDF
将网页转化为pdf供打印和下载,是个普遍的功能,项目中遇到整理下。
前台浏览器
通过jspdf
javascript库在浏览器端生成pdf
优点: 可用通过前台搞定,不用添加后台方法
缺点:
- pdf布局麻烦
- 不支持
Unicode
,所以不支持中文。(当然也有解决办法但需要依赖字体文件,文件太大不理想)
后台实现
后台实现的方法有很多种,大概原理为:通过一个浏览器内核程序接受HTML内容解析,在生成pdf。所以后台生成pdf支持:
- 根源URL生成pdf
- 根据HTML内容生成pdf
WkHtmlToPdf
该工具的功能就是把html转为pdf文件用于存档。 为了使用该工具必须先要下载该工具。该工具为exe
文件。
这里介绍简单好用的https://www.nrecosite.com/pdf_generator_net.aspx
,.Net
对exe
的调用提供了包装。不要看到他是邮费的被吓到,其实用免费的功能就能满足。
- 引用动态库
NReco.PdfGenerator.dll
- 代码操作简单,这里举例将html内容转化为pdf流
private Stream ConvertHtmlToPDF(string htmlContent)
{
MemoryStream pdfStream = new MemoryStream();
var htmlToPdf = new HtmlToPdfConverter();
htmlToPdf.GeneratePdf(htmlContent, null, pdfStream);
return pdfStream;
}