from parsel import Selector
'''
parsel 是一个Python的第三方库,相当于css选择器+xpath+re
需要安装: pip install parsel
'''
html = '''
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>标签选择器</title>
</head>
<body>
<p>css标签选择器的介绍</p>
<p class="p">标签选择器,类选择器,ID选择器</p>
<a href="https://baidu.com" title="百度搜索">百度一下</a>
<span>我是一个span标签</span>
<div id="map">
<p class="content">早上好,今天星期一</p>
</div>
<span id="map">
<p class="content">晚上好,今天星期一</p>
</span>
<span id="text">你好,我是一行文字</span>
</body>
</html>
'''
# 生成parsel对象
selector = Selector(html)
# getall 查询所有
# print(selector.css('#map').getall())
# get 获取第一条
# print(selector.css('.content').getall())
# 获取属性
# print(selector.css('a::attr(href)').get())
# 获取标签中的内容
# print(selector.css('#text::text').get())
# 选择器混合使用
# print(selector.css('#map p.content::text').getall())
# 使用xpath
# print(selector.xpath('//div[@class="map"]/p/text()').get())
# 使用正则
# print(selector.re('<p class="content">(.*?)</p>'))
# 混合使用
print(selector.xpath('//div[@id="map"]').re('<p class="content">(.*?)</p>'))
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架