8.解析HTML单个标签
from bs4 import BeautifulSoup file=open("./baidu.html","rb") html=file.read() bs=BeautifulSoup(html,"html.parser") print(bs.title) print(bs.a)#将打印出第一个该标签里面所有内容 print(bs.head) print(type(bs.head))#<class 'bs4.element.Tag'> #1.Tag 标签及其内容:拿到它所找到的第一个内容 print(bs.title.string) print(type(bs.title.string))#<class 'bs4.element.NavigableString'> #2.NavigableString 标签里的内容(字符串) print(bs.a.attrs)#获取第一个该标签里面的所有属性,字典格式显示出来 print(type(bs))#<class 'bs4.BeautifulSoup'> #3.BeautifulSoup 表示整个文档 print(bs.name)#[document] print(bs.a.string) print(type(bs.a.string))#<class 'bs4.element.Comment'> #4.Comment 是一个特殊的NavigableString,输出的内容不包含注释符合