8.解析HTML单个标签

from bs4 import BeautifulSoup
file=open("./baidu.html","rb")
html=file.read()
bs=BeautifulSoup(html,"html.parser")
print(bs.title)
print(bs.a)#将打印出第一个该标签里面所有内容
print(bs.head)
print(type(bs.head))#<class 'bs4.element.Tag'>
#1.Tag 标签及其内容:拿到它所找到的第一个内容
print(bs.title.string)
print(type(bs.title.string))#<class 'bs4.element.NavigableString'>
#2.NavigableString 标签里的内容(字符串)
print(bs.a.attrs)#获取第一个该标签里面的所有属性,字典格式显示出来
print(type(bs))#<class 'bs4.BeautifulSoup'>
#3.BeautifulSoup 表示整个文档
print(bs.name)#[document]
print(bs.a.string)
print(type(bs.a.string))#<class 'bs4.element.Comment'>
#4.Comment 是一个特殊的NavigableString,输出的内容不包含注释符合

 

posted @ 2021-03-09 09:38  种太阳  阅读(20)  评论(0编辑  收藏  举报