微信公众号文章提取并保存为PDF

有时会看到非常好的公众号文章想保存下来供以后参阅,避免文章被删的情况,笔者介绍几种方法以供参考。

手动保存

找到公众号链接,如下篇:https://mp.weixin.qq.com/s/8fhYaOnAwqCOZwip__3zcg

 

 

在浏览器打开

 

 

 

然后 ctrl+p 

 

 

 

 点击保存即可。

 

存在问题,有的图片无法显示,可以在预览完成之后再保存。

 

利用python下载保存

 

首先,下载安装wkhtmltopdf,下载地址:https://wkhtmltopdf.org/downloads.html

 

 

 

记住安装的文件夹,添加环境变量。

 

 

 

打开cmd, 输入“ wkhtmltopdf ”,检查是否安装完成。

 

 

 

 

安装 pdfkit包,这个包是 wkhtmltopdf 实用程序,用于使用 Webkit 将 HTML 转换为 PDF

 

1
pip install pdfkit  (or pip3 for python3)

 

用法 

 

打开 IDLE

 

1
2
3
4
5
import pdfkit
 
pdfkit.from_url('http://360.com', 'out.pdf')
pdfkit.from_file('test.html', 'out.pdf')
pdfkit.from_string('Hello!', 'out.pdf')

  

输出即为PDF,完成显示True.

 

 

 

 

默认保存在python 的根目录下。

 

 

 

 

多个链接同时保存

 

1
pdfkit.from_url(['google.com', 'yandex.ru', 'engadget.com'], 'out.pdf')

  

 

用编辑器完成代码:

 

1
2
3
4
import pdfkit
 
url = 'https://mp.weixin.qq.com/s/8fhYaOnAwqCOZwip__3zcg'
pdfkit.from_url(url, 'out.pdf')

 

 

  

三行代码,即可下载。

 

 

1
2
3
4
5
import pdfkit
 
url = ['https://cn.bing.com','baidu.com']
 
pdfkit.from_url(url, 'out.pdf')

 

  

 

  

posted @   徐海建  阅读(2541)  评论(1编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示