python系列(亲测有效):lxml数据解析小技巧; element对象转化成str, 并使用正则替换HTML标签, 保留内容(gvm专用,类比pretty_print)

lxml数据解析小技巧; element对象转化成str, 并使用正则替换HTML标签, 保留内容

功能: element对象转化成str, 并使用正则替换HTML标签, 保留内容, 非贪婪模式

def string_process(element):
    string = etree.tostring(element, encoding='utf-8').strip().decode('utf-8')
    return re.sub('<[^>]*>', '', string).strip()







qq_43031234

lxml数据解析小技巧; element对象转化成str, 并使用正则替换HTML标签, 保留内容

posted @   坦笑&&life  阅读(10)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示