会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
布都御魂
博客园
首页
新随笔
联系
订阅
管理
2024年10月8日
获取网页的markdown
摘要: # 获取网页源码 import re import html2text import requests def preprocess_html(html): # 删除没有 src 属性的 img 标签 processed_html = re.sub(r'<img(?![^>]*\ssrc=)[^>]
阅读全文
posted @ 2024-10-08 11:30 布都御魂
阅读(5)
评论(0)
推荐(0)
编辑
公告