python爬虫(二十) select方法
有时候需要css选择器
1、通过标签名查找:
<style type="text/css"> p{ background-color:pink; } </style> <body> <div class="box"> <p>123</p> <p>456</p> </body>
print(soup.select('p'))
这时就可以查到123和456得数据
2、通过类名查找:
<style type="text/css"> .line{ background-color:pink; } </style> <body> <div class="box"> <p class="line">123</p> <p>456</p> </body>
print(soup.select('.line'))
这样就可以查到123得数据
3、通过id查找:
<style type="text/css"> #line1{ background-color:pink; } </style> <body> <div class="box"> <p id="line1">123</p> <p>456</p> </body>
print(soup.select('#sister'))
这样可以查到123得数据
4、通过组合查找:
<style type="text/css"> .box p{ background-color:pink; } </style> <body> <div class="box"> <p>123</p> <p>456</p> </body>
print(soup.select('p #sister'))
这样可以得到box下面得p标签,123和456得值
5、通过属性查找
<style type="text/css"> input[name='username']{ background-color:pink; } </style> <body> <form> <input type="text" name="username"> </form> </body>
print(soup.select('a[href="http://example.com/elsie"]'))
可以得到这个input标签