Python__Xpath模块

复制代码
import requests
from lxml import etree   # 导入xpath

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36'
}

tree = etree.parse('./相关/test.html')
#定位标签
# print(tree.xpath('//div')) #定位指定的所有标签
#属性定位
# print(tree.xpath('//div[@class="tang"]'))
#索引定位:索引是从1开始的
# print(tree.xpath('//div[1]'))
#层级定位:/表示一个层级,//表示多个层级
# print(tree.xpath('//div[@class="tang"]/ul/li[4]/a'))
# print(tree.xpath('//div[@class="tang"]//li[4]/a'))


#内容提取:/text(),//text()
# print(tree.xpath('//div[@class="tang"]/ul/li[4]/a/text()')[0])
#取属性值:/@atrrName
# print(tree.xpath('//div[@class="tang"]/ul/li[4]/a/@href')[0])
复制代码

 

posted @   映辉  阅读(106)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示