有br时,获取文本
当使用xpath获取html页面元素时,如果某个element中包含有<br>标签,使用xpath将无法获取到完整的数据。因为br标签即可以表示数据的开始,也可以表示数据的结束。
# BeautifulSoup
about_us = driver.page_source
about_us_parse = BeautifulSoup(about_us, "lxml")
about_us_parse.p.get_text('', '<br>').strip()
# Selenium xpath
descendant-or-self::text() 选取当前节点的所有后代元素(子、孙等)以及当前节点本身
'//td[@class="listr" and contains(text(), "CN")]//descendant-or-self::td'
# 最简单的办法 get_attribute('textContent')
self.driver.find_elements(By.CSS_SELECTOR,".ocms").get_attribute('textContent')
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)