1.互联网图片抓取
说明:图片、音频、视频在计算机中以二进制方式存储
实现:找到所在图片的URL地址、想图片URL地址发送请求,获取二进制响应内容(bytes)、
正常打开文件,将响应内容以wb方式保存到本地
requests模块:
html = requests.get(url=url,headers=headers).text
响应对象(res)属性:
res.text: 获取响应对象内容-字符串
res.content: 获取响应对象内容-bytes
res.status_code: 获取http响应码
res.url: 返回实际数据的URL地址
2.爬取图片到本地
思路:一定要找到图片的真实URL地址
import requests
from fake_useragent import UserAgent
url = 'https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fwx1.sinaimg.cn%2Fmw690%2F82f2895bgy1h5le6cuiaxj20j60ooq6d.jpg&refer=http%3A%2F%2Fwx1.sinaimg.cn&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1664773567&t=86fbc94c5d3f5c9798fd47c9115ffaa7'
headers = { 'User-Agent': UserAgent().random }
# 一定使用content属性,因为图片以二进制方式存储的
html = requests.get(url=url, headers=headers).content
保存图片到本地
with open('girl.jpg', 'wb') as f:
f.write(html)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App