python etree 截取部分取其xpath：.//

import requests as r
from lxml import etree
import re,os,random,time

url='http://xxx.com/xx'

res=r.get(url)
html=etree.HTML(res.text)

title=html.xpath('//title/text()')

lis=html.xpath('//ul[@class="viewlist_ul"]/li[@name="lazyloadcpc"]')
print('共得到车个数：',len(lis))

cars=[]
for li in lis:
    name=li.xpath('.//h4[@class="card-name"]/text()')[0]  #【从当前节点取数据要用】 .//

    zonghe=li.xpath('.//p[@class="cards-unit"]/text()')[0]
    zh=re.findall(r'(.*?)／(.*?)／(.*?)／(.*)',zonghe)
    licheng=zh[0][0].replace('万公里','')
    year=zh[0][1]
    address=zh[0][2]
    shangjia=zh[0][3]

    price=li.xpath('.//span[@class="pirce"]//text()')
    price=price[-1] if price[-2]=='抢购价' else price[-2] #如果内部有抢购价则价格取-1,否则取-2

    price2=li.xpath('.//div[@class="cards-price-box"]/s/text()')[0]

    tag=li.xpath('.//div[@class="cards-price-box"]/span[@class="tags"]/i/text()')
    tag=tag[0] if tag else '' #如果tag存在内容则=tag[0],否则=''

    cars.append({'车名':name,'里程':licheng,'年份':year,'地址':address,'商家':shangjia,
        '价格':price,'原价':price2,'其它':tag
        })

print(cars)

posted @ 2021-12-18 11:59 晨光曦微阅读(209) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现

公告

昵称：晨光曦微
园龄： 6年4个月
粉丝： 47
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

晨光曦微

python etree 截取部分取其xpath：.//

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

晨光曦微

python etree 截取部分 取其xpath：.//

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

python etree 截取部分取其xpath：.//