爬虫实战---爬取图片
| import requests |
| import re |
| for page in range(1,11): |
| if page==1: |
| url="http://www.netbian.com/meinv/index.htm" |
| else: |
| url=f'http://www.netbian.com/meinv/index_{page}.htm' |
| headers={ |
| 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.178.400 QQBrowser/11.2.5170.400' |
| } |
| |
| response=requests.get(url,headers=headers) |
| response.encoding=response.apparent_encoding |
| img_info=re.findall('<a href="(.*?)" title=".*?" target="_blank"><img src=".*?" alt="(.*?)" />',response.text) |
| |
| for link,title in img_info: |
| link_url='http://www.netbian.com'+link |
| response_1 = requests.get(url=link_url,headers=headers) |
| response_1.encoding=response_1.apparent_encoding |
| img_url=re.findall('target="_blank"><img src="(.*?)" alt=".*?"',response_1.text)[0] |
| print(img_url) |
| img_content = requests.get(url=img_url,headers=headers).content |
| with open('img\\'+title+'.jpg',mode='wb') as f: |
| f.write(img_content) |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现