2019 年 10月 18 日随笔档案 - 思翰爹

2019年10月18日

摘要：最近在做一个项目，需要爬取一个系统的所有（动态）页面，并将每个网页都存为一个PDF文件。由于是内部系统，没有反爬，所以爬虫编写并不复杂，保存网页支持Python的工具搜了下，主要有两个： 1，PdfKit，基于wkhtmlpdf，后者是c语言编写的； 2，Weasyprint，好像是一个纯Pytho 阅读全文

posted @ 2019-10-18 17:19 思翰爹阅读(208) 评论(0) 推荐(0) 编辑

思翰爹

公告