Python爬图片

 1 import requests
 2 from lxml import etree
 3 
 4 header = {
 5     "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36"
 6 }
 7 
 8 
 9 def spider(page_num):
10     url = f"https://www.169tp.com/xingganmeinv/list_1_{page_num}.html"
11 
12     # 获取到网页初始数据text
13     res = requests.get(url, headers=header)
14     res.encoding = 'gbk'
15     text = res.text
16     tree = etree.HTML(text)
17 
18     lis = tree.xpath("/html/body/div[4]/ul/li")
19 
20     for i in lis:
21         addr = i.xpath("./a/img/@src")[0]
22         title = i.xpath("./a/p/text()")
23 
24         detail = requests.get(addr,headers=header).content
25 
26         f = open(f"imgs/{title}.jpg", mode="wb")
27         f.write(detail)
28         f.close()
29         print(f"图片 --------- {title} ------------- 完成！！")
30 
31 
32 def start():
33     for i in range(1,101):
34         spider(i)
35 
36 
37 if __name__ == '__main__':
38     start()

posted @ 2023-04-11 22:14 映辉阅读(26) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Python爬图片（面向对象版）

· requests + tkinter 获取网页数据

· python 图片爬取

· 爬百度图片

· Python爬取某个网站的图片

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构

yhBlog

Python爬图片

公告

搜索

最新随笔

我的标签

积分与排名

随笔分类 (410)

随笔档案 (344)

阅读排行榜

评论排行榜

推荐排行榜

最新评论