BeautifulSoup 用法

一、标签选择器

1、子节点contents child(迭代器)

2、子孙节点 descendants(迭代器)

3、父节点 parent  

4、祖节点  parents

5、兄弟节点 next_siblings (下一个兄弟) previous_siblings(上一个兄弟)

二、标准选择器

1、find_all(name,attrs,recursive,text,**kwargs)

name

attrs        

text

 

2、find(name,attrs,recursive,text,**kwargs)

find返回单个元素,find_all返回所有元素

 

 

三、CSS选择器

通过select()直接传入css选择器就可以完成选择

 

获取属性

 

获取内容

 

总结

推荐使用lxml解析库,必要是使用html.parser

l 标签选择器筛选功能弱但是速度快

建议使用find(),find_all()查询匹配单个结果或者多个结果

如果对CSS选择器熟悉建议使用select

l 记住常用的获取属性和文本值得方法

posted @ 2018-04-15 19:32  菜鸟程序猿_python  阅读(317)  评论(0编辑  收藏  举报