paresl方法


from parsel import Selector
'''
parsel 是一个Python的第三方库,相当于css选择器+xpath+re
需要安装: pip install parsel

'''
html = '''
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>标签选择器</title>
</head>
<body>
<p>css标签选择器的介绍</p>
<p class="p">标签选择器,类选择器,ID选择器</p>
<a href="https://baidu.com" title="百度搜索">百度一下</a>
<span>我是一个span标签</span>
<div id="map">
<p class="content">早上好,今天星期一</p>
</div>
<span id="map">
<p class="content">晚上好,今天星期一</p>
</span>
<span id="text">你好,我是一行文字</span>

</body>
</html>
'''
# 生成parsel对象
selector = Selector(html)

# getall 查询所有
# print(selector.css('#map').getall())
# get 获取第一条
# print(selector.css('.content').getall())

# 获取属性
# print(selector.css('a::attr(href)').get())

# 获取标签中的内容
# print(selector.css('#text::text').get())

# 选择器混合使用
# print(selector.css('#map p.content::text').getall())

# 使用xpath
# print(selector.xpath('//div[@class="map"]/p/text()').get())

# 使用正则
# print(selector.re('<p class="content">(.*?)</p>'))

# 混合使用
print(selector.xpath('//div[@id="map"]').re('<p class="content">(.*?)</p>'))

posted @ 2022-08-17 15:18  冬天不下雨  阅读(64)  评论(0编辑  收藏  举报