css selector
CSS选择器
Beautiful Soup支持大部分的CSS选择器 ,在 Tag 或 BeautifulSoup 对象的 .select() 方法中传入字符串参数,即可使用CSS选择器的语法找到tag:
soup.select("title")
p:nth-child(2) 选择属于其父元素的第二个<p>元素的 所有元素的第二个。
p:nth-of-type(2) 选择属于其父元素 第二个 <p> 元素 所有<p>元素的第二个。
bs4 仅仅支持nth-of-type
soup.select("ul li:nth-of-type(3)")
通过tag标签逐层查找: 可以隔代
soup.select("body a")
找到某个tag标签下的直接子标签 直系
soup.select("head > title")
.class #id
通过CSS的类名查找:
soup.select(".sister")
通过tag的id查找:
soup.select("#link1")
http://www.w3school.com.cn/cssref/css_selectors.ASP