BeautifulSoup, 的使用

import bs4.BeautifulSoup
soup = BeautifulSoup(response,'lxml')
print soup.prettify()#格式化输出

四大对象种类

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种:

  1.     Tag
  2.     NavigableString
  3.     BeautifulSoup
  4.     Comment
print soup.title

#获取标签的内容

 

posted @ 2017-05-13 15:05  200六  阅读(119)  评论(0编辑  收藏  举报