BeautifulSoup基本用法

BeautifulSoup是可以从HTML或者XML文件中提取数据的Python库

一般配合requests使用

一、引入

from bs4 import BeautifulSoup

BeautifulSoup 所支持的解析器

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment

Tag对象：对象与XML或HTML原生文档中的tag相同
每个tag 都有自己的名字，Tag.name 来获取，tag可能有很多个属性. tag <b class="boldest"> 有一个 “class” 的属性,值为 “boldest” . tag的属性的操作方法与字典相同: tag['class'] = "boldest"

可以遍历字符串，字符串常被包含在tag内.Beautiful Soup用 NavigableString 类来包装tag中的字符串，tag.string

————————————————
版权声明：本文为CSDN博主「maverick17」的原创文章，遵循CC 4.0 by-sa版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/maverick17/article/details/79610050

posted @ 2019-08-23 11:16 Whisperbb 阅读(1330) 评论(0) 收藏举报

刷新页面返回顶部

Whisperbb

BeautifulSoup基本用法

公告