如果熟悉jquery,那么使用pyquery进行网页信息提取将会是非常方便的,因为语法都是一样的
1、字符串初始化
2、url和文件初始化
3、CSS选择器
4、子元素
5、父元素
6、兄弟节点
7、遍历元素
8、获取属性
9、获取文本,这里跟beautifulsoup一样
10、获取html
11、DOM操作
删除或者修改样式
修改css以及attr
删除标签
伪类选择器