50 行 Python 代码抓取 divnil 动漫妹子图!
目标网站https://divnil.com
首先看看这网站是怎样加载数据的;
打开网站后发现底部有下一页的按钮,ok,爬这个网站就很简单了;
我们目标是获取每张图片的高清的源地址,并且下载图片到桌面;
先随便打开一张图片看看详细;
emmm,只有一张图
看起来还挺清晰的,单击新窗口打开图片
然后下载图片,说实话,这图片很小,我很担心不是高清原图(管他的);
PS:一定要禁用广告拦截插件,不然加载不出图,我就在这被坑T_T;
接着分析我们从何入手
1、先去主页面获取每个图片的详细页面的链接
这链接还是比较好获取的,直接 F12 审核元素,或者右键查看代码,手机上chrome和firefox在url前面加上 "view-source"
比如:view-source:https://www.baidu.com/
2、从详细页面获取图片大图地址
随便打开一个图片详细页面如图:
接着按 F12 审核元素,我们需要定位该图片的链接,首先单击左上角的这玩意儿,像一个鼠标的图标:
接着只需要单击网页上的图片就能定位到代码了:
3、用大图地址下载该图片
这个很简单,看代码
先安装 Requests 和 BeautifulSoup 库
pipinstallrequests bs4
导入库
importrequestsfrom bs4importBeautifulSoupimport sys
请求获取网页源代码

然后解析出所有图片的详细地址

接着在详细网页里获取那个看似高清的图片的不确定是否为真实图片链接并下载(/滑稽)


主要代码
完成,贴上所有代码

本文来自博客园,作者:I'm_江河湖海,转载请注明原文链接:https://www.cnblogs.com/jhhh/p/16765288.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix