谷歌浏览器的xpath插件安装
1.使用urllib爬取百度搜索html2.urllib.request.Request对象封装请求3.urllib发送get请求_中文传参问题4.urllib发送post请求获取html源代码5.获取动态页面html6.忽略SSL证书验证7.使用fake-useragent库伪装请求头8.urllib自定义opener对象设置代理IP9.爬虫cookie的使用10.保存与读取cookie11.使用urllib.error进行请求异常处理12.使用requests库发送get和post请求13.使用Request伪装User-Agent和IP地址14.requests设置超时时间/requests.Session自动保存cookie/verify忽略ssl证书15.re模块的正则表达式规则16.使用re的正则表达式提取腾讯体育新闻摘要17.BeautifulSoup4解析数据18.bs4.find_all()搜索文档树和css选择器提取解析后的html数据19.bs4解析并提取人民网新闻标题数据20.xpath解析数据
21.谷歌浏览器的xpath插件安装
22.使用re和lxml的xpath功能提取纵横中文网小说推荐榜前3页标题23.JSON数据24.使用jsonpath快速提取json的数据25.提取猫眼电影正在热映电影以及评分26.单线程与多线程爬虫直接在谷歌应用商店下载插件需要科.学.上网。如果不想科.学.上网可以在第三方网站下载插件,例如谷歌浏览器插件网:https://www.chajian5.com/
。
在搜索框中输入xpath,点击搜索,跳转页面后选择xpath插件(以xpath helper为例)
选择xpath helper,点击进入下载页。使用解压安装包的方式添加扩展程序:
- 下载XPath-Helper_v2.0.2.crx压缩文件夹到本地
- 修改后缀为rar
- 使用winrar、7z或其它解压工具将文件解压
- 打开解压后的文件夹,去除
_metadata
的下划线,修改为metadata
- 打开谷歌管理扩展程序界面
chrome://extensions/
- 启用开发者模式
- 点击“加载已解压的扩展程序”,选择解压好的文件夹
网站有非常清晰的教程,可以在“如何安装插件(新手必看)”中查看。
配置完成可以在扩展程序设置固定xpath helper,单击xpath helper,在query中输入xpath,能及时看到结果results。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 【杂谈】分布式事务——高大上的无用知识?