Python3 获取网络图片并且保存到本地
Python3 获取网络图片并且保存到本地
import requests from bs4 import BeautifulSoup from urllib import request import sys import re import os def getNews(title,url,m): Hostreferer = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36' } req = request.Request(url) response = request.urlopen(req) #过滤非utf-8的网页新闻 response = response.read().decode('utf-8',"ignore") soup = BeautifulSoup(response,'lxml') tag = soup.find('div',class_='article') if tag == None: return 0#获取文章内容 rep = re.compile("[\s+\.\!\/_,$%^*(+\"\']+|[+<>?、~*()]+") title = rep.sub('',title) title = title.replace(':',':') filename = sys.path[0]+"/news/"+title+".txt" with open(filename,'w',encoding='utf8') as file_object: file_object.write("网址:"+url) file_object.write("\n") file_object.write(title) file_object.write(tag.get_text()) i = 0 for image in tag.find_all('div','img_wrapper'): title_img = title +str(i) # 保存图片 #判断目录是否存在 if (os.path.exists(sys.path[0]+"/news/"+title)): pass else: #不存在,则新建目录 os.mkdir(sys.path[0]+"/news/"+title) os.chdir(sys.path[0]+"/news/"+title) file_name = "http://news.***.com.cn/"+image.img.get('src').replace('//','') html = requests.get(file_name, headers=Hostreferer) # 图片不是文本文件,以二进制格式写入,所以是html.content title_img = title_img +".jpg" f = open(title_img, 'wb') f.write(html.content) f.close() i+=1 print('成功爬取第', m,'个新闻',title) return 0
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南