按原样输出网页内容
ir_content = tree.xpath('//p[@align="justify"]//text()')
if ir_content == []:
ir_content = tree.xpath('//td/p/span//text()')
neirong = '\u3000\u3000'
for i in ir_content:
da = i.strip().replace(' ', '').replace('\n', '').replace('\r', '')
if len(da) == 0:
pass
else:
neirong += da
neirong += '\n'
neirong += '\u3000\u3000'
neirong = neirong.replace('"', '')
本文作者:布都御魂
本文链接:https://www.cnblogs.com/wolvies/p/15433479.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步