会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
思翰爹
博客园
首页
新随笔
联系
订阅
管理
2019年10月18日
保存网页为PDF
摘要: 最近在做一个项目,需要爬取一个系统的所有(动态)页面,并将每个网页都存为一个PDF文件。由于是内部系统,没有反爬,所以爬虫编写并不复杂,保存网页支持Python的工具搜了下,主要有两个: 1,PdfKit,基于wkhtmlpdf,后者是c语言编写的; 2,Weasyprint,好像是一个纯Pytho
阅读全文
posted @ 2019-10-18 17:19 思翰爹
阅读(208)
评论(0)
推荐(0)
编辑
公告