Python Xpath的应用

  • lxml
    lxml是文本解析的强大轮子,其中就业xpath功能
  • Xpath
    XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。
  • 实战:获取某东商品分类
import requests
from lxml import etree

resp=requests.get('https://www.jd.com/')
doc_main=etree.HTML(resp.content)
for x in doc_main.xpath('//body/div/div/div/div/div/ul/li'):      #这里是绝对路径
    print(*x.xpath("a/text()")+x.xpath("a/@href"))                #这里是相对路径
    
  • 火狐浏览器查看xpath:
    1. 右击查看元素
    2. 开启选择元素后,点击查看想要的元素
    3. 右击复制xpath
posted @ 2018-01-31 17:23  我也想学编程  阅读(197)  评论(0编辑  收藏  举报