【Python/爬虫】一个类化的网络图片批量下载爬虫
代码:
#encoding=utf-8 import urllib.request import os class WebPicDownloader: def __init__(self,path,start,end,extension,folder): self.folder=folder os.makedirs(folder) # 创建目录 self.fileUrls={} # 用一个字典去存文件名和地址 for i in range(start,end+1): name=str(i).zfill(2) #string.zfill(n)是字符串的左补零函数 fileName=name+extension picUrl=path+fileName self.fileUrls[fileName]=picUrl print('要下载的图片地址列表装填完毕,共有'+str(len(self.fileUrls))+'张图片.') self.batchDownload() def batchDownload(self): print('开始逐个下载图片.') for file,url in self.fileUrls.items(): self.downloadOne(file,url) #self.method 调用本类方法 def downloadOne(self,file,url): with urllib.request.urlopen(url) as response: data=response.read() filePathName=self.folder+"/"+file with open(filePathName,'wb') as f: f.write(data) print('从:'+url+'下载的文件已存为文件:'+filePathName) dld=WebPicDownloader("https://tu.gtmm.net:8988/listImg/2020/07/07/107/",1,20,".jpg","xyyx01")
这个爬虫针对的地址是:https://www.gtmm.net/rhmn/list_5_12.html ,灵泛的同学观察出规律就可以去批量下载了。
END
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)
2017-10-01 【Canvas与诗词】卧看牵牛织女星
2013-10-01 【Canvas与表盘】绘制黄蓝双色简约表盘