...

摘要: 很多教程网站都是静态html,爬取起来相对容易,使用requests请求页面后把响应内容保存为html文件即可。 一般爬取步骤如下: 1. 从首页解析出课程列表,包含课程标题和URL链接 2. 请求课程页面,解析出文章列表,包含文章标题和文章URL链接 3. 请求文章页面,将响应内容保存为html文 阅读全文
posted @ 2023-07-14 11:30 韩志超 阅读(235) 评论(1) 推荐(0) 编辑