会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
...
临渊
博客园
首页
新随笔
联系
订阅
管理
2023年7月14日
使用requests及lxml爬取教程示例
摘要: 很多教程网站都是静态html,爬取起来相对容易,使用requests请求页面后把响应内容保存为html文件即可。 一般爬取步骤如下: 1. 从首页解析出课程列表,包含课程标题和URL链接 2. 请求课程页面,解析出文章列表,包含文章标题和文章URL链接 3. 请求文章页面,将响应内容保存为html文
阅读全文
posted @ 2023-07-14 11:30 韩志超
阅读(235)
评论(1)
推荐(0)
编辑
公告