2024 年 11月 28 日随笔档案 - 屈臣

2024年11月28日

摘要：步骤 1.拿到页面源代码，然后提取子页面的链接地址，href 2.通过href拿到子页面内容，从子页面找到图片的下载地址 img->src 3.下载图片 import requests from bs4 import BeautifulSoup import re import time url=" 阅读全文

posted @ 2024-11-28 23:17 屈臣阅读(15) 评论(0) 推荐(0) 编辑

如何用协程扒光一部小说

摘要：郑重声明以下代码是我跟着视频一个一个敲的，如有相同，只能说看的是一个视频，还有，过程完全是自己一个一个字打的，如有雷同，纯属巧合。视频出处： https://www.bilibili.com/video/BV1uN4y1W7Du/?p=66&share_source=copy_web&vd_so 阅读全文

posted @ 2024-11-28 22:25 屈臣阅读(17) 评论(0) 推荐(0) 编辑

如何用协程扒光一部小说

摘要：前言本次爬取的小说对象是《西游记》，如标题所示，利用协程来完成，为何利用协程？协程（Coroutine）是一种轻量级的程序执行单元，它可以在一个线程内实现多个任务的并发执行。通过协程我可以更快的爬取小说的内容和下载小说的内容。相比于我之前所写的单线程来说，效率提高了n倍。虽然我所爬取的小说内容阅读全文

posted @ 2024-11-28 21:54 屈臣阅读(4) 评论(0) 推荐(0) 编辑

quchen-blog

公告