摘要: # 获取网页源码 import re import html2text import requests def preprocess_html(html): # 删除没有 src 属性的 img 标签 processed_html = re.sub(r'<img(?![^>]*\ssrc=)[^>] 阅读全文
posted @ 2024-10-08 11:30 布都御魂 阅读(5) 评论(0) 推荐(0) 编辑