表情党抓取(单页) (网站已转移)
表情党抓取(单页) (网站已转移)
创建时间:2024-08-06
一、完整代码
import requests
from lxml import etree
url = 'https://qq.yh31.com/xq/wq/'
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0'
}
res = requests.get(url=url,headers=header)
res.encoding = res.apparent_encoding
data = res.text
tree = etree.HTML(data)
src_list = tree.xpath('//div[@class="sr"]//@data-src')
alt_list = tree.xpath('//div[@class="sr"]//@alt')
for src,alt in zip(src_list,alt_list):
res = requests.get(url=src,headers=header)
print(f'下载---{alt.strip()}---中')
with open(f'./bqd/{alt}.png','wb') as f:
f.write(res.content)
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步