python爬虫(二十) select方法

有时候需要css选择器

1、通过标签名查找:

<style type="text/css">
      p{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p>123</p>
       <p>456</p>
</body>
print(soup.select('p'))

这时就可以查到123和456得数据

2、通过类名查找:

<style type="text/css">
      .line{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p  class="line">123</p>
       <p>456</p>
</body>
print(soup.select('.line'))

这样就可以查到123得数据

3、通过id查找:

<style type="text/css">
      #line1{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p  id="line1">123</p>
       <p>456</p>
</body>
print(soup.select('#sister'))

这样可以查到123得数据

4、通过组合查找:

<style type="text/css">
      .box  p{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p>123</p>
       <p>456</p>
</body>
print(soup.select('p #sister'))

这样可以得到box下面得p标签,123和456得值

5、通过属性查找

<style type="text/css">
      input[name='username']{
            background-color:pink;
        }
</style>
<body>
     <form>
     <input  type="text" name="username">
     </form>
</body>
print(soup.select('a[href="http://example.com/elsie"]'))

可以得到这个input标签

posted on 2020-03-11 20:15  方木Fengl  阅读(1743)  评论(0编辑  收藏  举报

导航