PyQuery网页解析库
from pyquery import PyQuery as pq
-
字符串初始化:
doc = pq(html)
-
URL初始化:
doc = pq(url = “···”)
-
文件初始化:
doc = pq(filename = “demo.html”)
-
CSS选择器(id前加#,class前加.):
1.查找元素:find() 返回所有元素
2.遍历元素:items()
- DOM操作:
1.addclass、removeclass
2.attr 增加name属性
3.css 增加style属性
4.remove 删除标签