scrapy 正则提取数据
一直使用xpath和css提取数据,但是有些时候需要处理一些数字,使用正则相对来说更简单些
比如 只想提取a标签里的245,用xpath和css还需要特殊处理
1 page_list = response.xpath(
2 '//div[@class="paging_content"]/div[@class="m-page"]/a[1]/text()').re(r'\d{1,}')
3 if page_list and len(page_list) > 0:
4 page_count = int(page_list[0])
page_list提取出来的是一个list,需要转换类型
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步