lxml解析数据结合Xpath

lxml解析数据结合Xpath

复制import requests
from lxml import etree

#设置用户标识
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36'
}
url='https://www.1905.com/vod/top/lst/'
# 发送请求
html = requests.get(url,headers=header)
# 处理数据
print(html.text)
lxml = etree.HTML(html.text)
titles=lxml.xpath('//dl/dt/a[@target="_blank"]')
for x in range(len(titles)):
    print(titles[x].tag)  #标签名
    print(titles[x].attrib)   #属性
    print(titles[x].text)   #文本

posted @   那个商同学  阅读(27)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示