摘要: 步骤 1.拿到页面源代码,然后提取子页面的链接地址,href 2.通过href拿到子页面内容,从子页面找到图片的下载地址 img->src 3.下载图片 import requests from bs4 import BeautifulSoup import re import time url=" 阅读全文
posted @ 2024-11-28 23:17 屈臣 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 郑重声明 以下代码是我跟着视频一个一个敲的,如有相同,只能说看的是一个视频,还有,过程完全是自己一个一个字打的,如有雷同,纯属巧合。 视频出处: https://www.bilibili.com/video/BV1uN4y1W7Du/?p=66&share_source=copy_web&vd_so 阅读全文
posted @ 2024-11-28 22:25 屈臣 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 前言 本次爬取的小说对象是《西游记》,如标题所示,利用协程来完成,为何利用协程? 协程(Coroutine)是一种轻量级的程序执行单元,它可以在一个线程内实现多个任务的并发执行。 通过协程我可以更快的爬取小说的内容和下载小说的内容。相比于我之前所写的单线程来说,效率提高了n倍。虽然我所爬取的小说内容 阅读全文
posted @ 2024-11-28 21:54 屈臣 阅读(4) 评论(0) 推荐(0) 编辑