python爬取网站图片保存到本地文件夹
爬取的网站
https://wallpaperscraft.com/catalog/anime
爬取代码
# 导包
import os
import requests
import parsel
from parsel import Selector
def download_onepagephoto(website_url,count): # 下载一页图片
# 用i暂存传输过来的count值
i=count
# 发送请求
response = requests.get(website_url)
response.encoding = response.apparent_encoding
# 很关键的一步,构建Selector对象
sel = Selector(response.text)
# 获取到网页中样式为wallpapers__item类下a标签的href的值
index = sel.css('.wallpapers__item a::attr(href)').getall()
# 遍历进入每个图片
for line in index:
# 模拟进入另一个页面,如法炮制上述操作
response = requests.get("https://wallpaperscraft.com"+line)
response.encoding = response.apparent_encoding
sel = Selector(response.text)
index2 = sel.css('.wallpaper__placeholder a::attr(href)').getall()
if len(index2)!=0:
nameurl=index2[0]
# 获取到图片链接,将其保存到同级目录本地photo文件夹
photo=requests.get(nameurl).content
with open("photo/"+str(i)+".jpg","wb") as fp:
fp.write(photo)
print(str(i)+" already success")
i=i+1
return i
count=1
#爬取第一页
count=download_onepagephoto("https://wallpaperscraft.com/catalog/anime/1920x1080",count)
#爬取第二页及以后
for temp in range(2,174):
count=download_onepagephoto("https://wallpaperscraft.com/catalog/anime/1920x1080/page"+str(temp),count)
print("第"+str(temp)+"页图片爬取完成")
【创作不易,望点赞收藏,若有疑问,请评论,谢谢】
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2020-04-29 小程序-自定义组件数据传递