BeautifulSoup, 的使用
import bs4.BeautifulSoup soup = BeautifulSoup(response,'lxml') print soup.prettify()#格式化输出
四大对象种类
Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种:
- Tag
- NavigableString
- BeautifulSoup
- Comment
print soup.title #获取标签的内容