Python Xpath的应用
- lxml
lxml是文本解析的强大轮子,其中就业xpath功能 - Xpath
XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。 - 实战:获取某东商品分类
import requests
from lxml import etree
resp=requests.get('https://www.jd.com/')
doc_main=etree.HTML(resp.content)
for x in doc_main.xpath('//body/div/div/div/div/div/ul/li'): #这里是绝对路径
print(*x.xpath("a/text()")+x.xpath("a/@href")) #这里是相对路径
- 火狐浏览器查看xpath:
- 右击查看元素
- 开启选择元素后,点击查看想要的元素
- 右击复制xpath