会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
莫多心情小站
———— I continue to fight.
首页
订阅
管理
2022年5月20日
【2022.05.20】对无验证码的整个网页公告的内容进行自适应爬取(1)
摘要: 学习内容 xpath,以及python字符串替换, url自适应拼接,因为很多网站的href不完整 使用Selenium 抓取动态页面内容 前言 这次要实现的是根据网址和xpath,去抓取同一页面中的所有公告内容 代码 源码 import requests from lxml import etre
阅读全文
posted @ 2022-05-20 19:41 Mokou
阅读(45)
评论(0)
推荐(0)
编辑
公告