准备工作
那怎么办呢,python里面有个模块是pdfkit,他可以帮咱们把一个html(也就是一个网页)变成一个pdf文件。
pdfkit是python对wkhtmltopdf这个把网页转成pdf工具的一个封装,所以咱们必须得先安装一个wkhtmltopdf,
这个工具的下载网站是:https://wkhtmltopdf.org/downloads.html,根据自己的操作系统下载对应的版本即可。ps:这里要记住安装目录啊,下面要用到它,不要忘记它的安装目录~
上面说到了pdfkit这个模块,这个是第三方模块,需要安装,使用pip安装即可。
pip install pdfkit
写代码实现
pdfkit它给咱们提供了很多功能,可以给它一个 url,他会自动获取 url 里面的内容,帮你保存好,也可以给他一个 html 文件,也可以保存,也可以给他一个字符串,也可以保存成 pdf,下面是代码:
import pdfkit url = 'https://www.cnblogs.com/lshan/'#my blogs confg = pdfkit.configuration(wkhtmltopdf='/home/sea/wkhtmltopdf.exe') #这里指定一下wkhtmltopdf的路径 pdfkit.from_url(url, 'sea_test下载文件.pdf',configuration=confg) # from_url这个函数是从url里面获取内容 # 这有3个参数,第一个是url,第二个是文件名,第三个就是khtmltopdf的路径 html=''' <div> <h1>title</h1> <p>content</p> </div> ''' #这个html是我从一个页面上拷下来的一段,也可以 #pdfkit.from_string(html, 'jmeter_下载文件3.pdf',configuration=confg) # from_file这个函数是从一个字符串里面获取内容 # 这有3个参数,第一个是一个字符串,第二个是文生成的pdf的名字,第三个就是khtmltopdf的路径
ko
分类:
python
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
2019-07-05 springboot对应的springcloud版本
2018-07-05 svn 技巧