python bs4爬取彼岸网任意页面的壁纸（以爬取1080p）为例

一：原创，过程可能较重复，但实现逻辑简单：

整个爬取逻辑：从一个页面跳转到另一个页面再获取（高清无损）壁纸的具体网址，然后下载就可。

二：用到的模块：requests，beautifulsoup模块*

三：具体实现代码(完整可直接使用）：

 import re
import requests
import time##### 
from bs4 import BeautifulSoup
from lxml import etree

headers={
"User-Agent":"User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36"
}
url="http://www.netbian.com/1920x1080/index_3.htm"
main_page=requests.get(url=url,headers=headers)
main_page.encoding=main_page.apparent_encoding

soup=BeautifulSoup(main_page.text,"lxml")
li_list=soup.select(".list li>a")

for li in li_list:
    li_herf=li["href"]
    the_real="http://www.netbian.com/"+li_herf
    response=requests.get(url=the_real,headers=headers)
    response.encoding=response.apparent_encoding
    real_soup=BeautifulSoup(response.text,"lxml")


    img=real_soup.select(".pic img")[0]["src"]#获得图片网址
    img_resp=requests.get(url=img,headers=headers)#request解析
    img_name=img.split("/")[-1]#根据具体而修改
    # print(img_name)
    # print(img)
    with open("bian/"+img_name,mode="wb")as f:
        f.write(img_resp.content)#不需要修改
        print("over",img_name)
        time.sleep(1)#防被服务器检测禁止ip访问

posted @ 2021-06-03 12:24 昊月光华阅读(19) 评论(0) 编辑收藏举报来源

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 关于python爬虫爬取网页图片的实例

· 关于python爬取的一种另类解密方法（字符串缝合）

· python爬虫——爬取壁纸网站

· python 爬虫抓取高清美女壁纸源码附上

· python爬虫案列04：爬取彼岸桌面4K壁纸

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

公告

昵称：昊月光华
园龄： 2年11个月
粉丝： 2
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

昊月光华

大道至简

python bs4爬取彼岸网任意页面的壁纸（以爬取1080p）为例

一：原创，过程可能较重复，但实现逻辑简单：

二：用到的模块：requests，beautifulsoup模块*

三：具体实现代码(完整可直接使用）：

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

推荐排行榜

昊月光华

大道至简

python bs4爬取彼岸网任意页面的壁纸（以爬取1080p）为例

一：原创，过程可能较重复，但实现逻辑简单：

二：用到的模块：requests，beautifulsoup模块*

***三：具体实现代码(完整可直接使用）***：

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

推荐排行榜

三：具体实现代码(完整可直接使用）：