欢迎这位怪蜀黍来到《Python爬虫小白入门(十三)Python 爬虫 – 使用CSS选择器 - 大码王 - 博客园》

关闭页面特效

BeautifulSoup对象支持使用CSS选择器查找标签。这些选择器是CSS语言中使用的指定HTML Tag样式的方式。

下面是一些例子:

  • p a — 在p标记中找到所有的a标签。
  • body p a — 在body标记内的p标记内查找所有a标签。
  • html body — 查找html标记内的body标签。
  • p.outer-text — 查找带有类是outer-text所有p标记。
  • p#first — 查找id为first的所有p标签。
  • body p.outer-text — 在body标记中查找类是outer-text的p标签。

使用CSS选择器查找标签,可以使用select方法:

import requests
from bs4 import BeautifulSoup

page = requests.get("https://kevinhwu.github.io/demo/python-scraping/simple2.html")
soup = BeautifulSoup(page.content, 'html.parser')

soup.select("div p")

输出

[<p class="inner-text first-item" id="first">
First paragraph.
</p>, <p class="inner-text">
Second paragraph.
</p>]

注意,上面的select方法返回一个BeautifulSoup对象列表,就像findfind_all一样。

 posted on   大码王  阅读(1361)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具

成都

复制代码

喜欢请打赏

扫描二维码打赏

了解更多

点击右上角即可分享
微信分享提示