10.文档的搜索find_all()

字符串过滤码:会查找与字符串完全匹配的内容

t_list=bs.find_all("a")
print(t_list)#将所有a标签内容放在列表中

 正则表达式搜索:使用search()方法来匹配内容

import re
t_list=bs.find_all(re.compile("a"))
print(t_list)#只要标签中含有a,就好加入到列表中

方法:传入一个函数(方法),根据函数的要求来搜索

def name_is_exists(tag):
    return tag.has_attr("name")
t_list=bs.find_all(name_is_exists)
print(t_list)#将打印出属性值有name的所有标签内容

kwargs 参数

t_list=bs.find_all(id="head")
t_list=bs.find_all(class_=True)#只要有class属性就行

text参数 只要内容中是有下面完全匹配内容的就打印出来

t_list=bs.find_all(text="hao123")
t_list=bs.find_all(text=["hao123","地图","贴吧"])
t_list=bs.find_all(text=re.compile("\d"))#只要文本中有数字的就找出来

limit 参数 当有很多个时,可以设置只想要几个

t_list=bs.find_all("a",limit=3)

 

posted @ 2021-03-09 09:42  种太阳  阅读(14)  评论(0编辑  收藏  举报