导航

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

统计

随笔 - 57
文章 - 0
评论 - 2
阅读 - 13257

互联网图片抓取

1.互联网图片抓取
说明：图片、音频、视频在计算机中以二进制方式存储
实现：找到所在图片的URL地址、想图片URL地址发送请求，获取二进制响应内容(bytes)、
正常打开文件，将响应内容以wb方式保存到本地
requests模块：
html = requests.get(url=url,headers=headers).text
响应对象(res)属性：
res.text: 获取响应对象内容-字符串
res.content: 获取响应对象内容-bytes
res.status_code: 获取http响应码
res.url：返回实际数据的URL地址

2.爬取图片到本地
思路：一定要找到图片的真实URL地址
import requests
from fake_useragent import UserAgent

url = 'https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fwx1.sinaimg.cn%2Fmw690%2F82f2895bgy1h5le6cuiaxj20j60ooq6d.jpg&refer=http%3A%2F%2Fwx1.sinaimg.cn&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1664773567&t=86fbc94c5d3f5c9798fd47c9115ffaa7'
headers = { 'User-Agent': UserAgent().random }

# 一定使用content属性，因为图片以二进制方式存储的
html = requests.get(url=url, headers=headers).content

保存图片到本地
with open('girl.jpg', 'wb') as f:
f.write(html)

posted on 2023-11-18 19:25 枫飘过的天1 阅读(16) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· requests+编码模块+百度贴吧数据抓取

· 爬取python网站下载地址，并下载最新文件

· 爬取网页图片

· Python爬取照片

· 爬取百度图片

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App

公告

昵称：枫飘过的天1
园龄： 5年8个月
粉丝： 2
关注： 1
+加关注

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 设置电脑同时连接内外网(windows)(2)

最新评论

1. Re:设置电脑同时连接内外网(windows)
“网络目标，网关，接口”一般应该都在同一网段，如172.44.34.0 mask 255.255.255.0 172.44.34.1 172.44.34.111 ，而博主给出来的貌似不在同一网段，不...
--静即青争
2. Re:设置电脑同时连接内外网(windows)
测试发现也许不删原0.0.0.0路由也行，直接添加新的内网网段路由就能访问内网。只是优先级（通过在窗口或命令行设置跃点数调整，可小于等于10以实现较高优先级）需要把外网的0.0.0.0设得高于内网0....
--静即青争