python爬虫网页解析之parsel模块

08.06自我总结

python爬虫网页解析之parsel模块

一.parsel模块安装

官网链接https://pypi.org/project/parsel/1.0.2/

pip install parsel==1.0.2

二.模块作用

改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配

三.使用

复制import requests
import parsel


response = requests.get(url)
sel = parsel.Selector(response.text)  #注意这里的S要大写

# re正则
# print(sel.re('正则匹配格式'))

# xpath
# print(sel.xpath('xpath').getall()) #getall获取所有

# css选择器
# print(sel.css('css选择器 ::text').extract_first())#获取第一个
posted @   小小咸鱼YwY  阅读(11120)  评论(2编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)

目录导航

点击右上角即可分享
微信分享提示