8.解析HTML单个标签

from bs4 import BeautifulSoup
file=open("./baidu.html","rb")
html=file.read()
bs=BeautifulSoup(html,"html.parser")
print(bs.title)
print(bs.a)#将打印出第一个该标签里面所有内容
print(bs.head)
print(type(bs.head))#<class 'bs4.element.Tag'>
#1.Tag 标签及其内容：拿到它所找到的第一个内容
print(bs.title.string)
print(type(bs.title.string))#<class 'bs4.element.NavigableString'>
#2.NavigableString 标签里的内容（字符串）
print(bs.a.attrs)#获取第一个该标签里面的所有属性，字典格式显示出来
print(type(bs))#<class 'bs4.BeautifulSoup'>
#3.BeautifulSoup 表示整个文档
print(bs.name)#[document]
print(bs.a.string)
print(type(bs.a.string))#<class 'bs4.element.Comment'>
#4.Comment 是一个特殊的NavigableString,输出的内容不包含注释符合

posted @ 2021-03-09 09:38 种太阳阅读(20) 评论(0) 编辑收藏举报

刷新页面返回顶部

种太阳

8.解析HTML单个标签

公告