爬虫5:Beautiful Soup的css选择器

学习于：http://cuiqingcai.com/1319.html

用到的方法是 soup.select()，返回类型是 list，用 get_text() 方法来获取它的内容

print soup.select('title') 

print soup.select('a')

print soup.select('b')

print soup.select('.sister')

（3）通过 id 名查找

print soup.select('#link1')

#查找 p 标签中，id 等于 link1的内容

print soup.select('p #link1')

#直接子标签查找

print soup.select("head > title")

#class=“sister”的a标签

print soup.select('a[class="sister"]')

print soup.select('p a[href="http://example.com/elsie"]')

posted @ 2017-01-17 22:52 RonyJay 阅读(869) 评论(0) 收藏举报

刷新页面返回顶部