2024 年 10月 8 日随笔档案 - 布都御魂

2024年10月8日

摘要： # 获取网页源码 import re import html2text import requests def preprocess_html(html): # 删除没有 src 属性的 img 标签 processed_html = re.sub(r'<img(?![^>]*\ssrc=)[^>] 阅读全文

posted @ 2024-10-08 11:30 布都御魂阅读(5) 评论(0) 推荐(0) 编辑

布都御魂

公告