用Python写了个抓图小脚本
看上这个网页上一张图了,可惜他没有提供右键另存为,看了下网页代码,是可以找到图片原始链接的!但是因为没法和现实的图片一一对应,图又多,所以找起来还是麻烦。。。然后,我就想用 Python 把他们全部拉下来再找了。
下面是代码:
#coding=utf-8 import urllib import re def downloadPage(url): h = urllib.urlopen(url) return h.read() def downloadImg(content): pattern = r'href="(.+?\.jpg)" class' m = re.compile(pattern) urls = re.findall(m, content) for i, url in enumerate(urls): print url urllib.urlretrieve(url, "%s.jpg" % (i, )) content = downloadPage("http://www.viajesalazul.com/holiday/lo-mejor-de-portugal-11-dias/") downloadImg(content)
话说,学了正则表达式 要常常练习啊,恩,代码有借鉴另一作者的(代码放硬盘里好久了,原始作者已无从查找),自己改了下正则表达式。
——————
无论在哪里做什么,只要坚持服务、创新、创造价值,其他的东西自然都会来的。
无论在哪里做什么,只要坚持服务、创新、创造价值,其他的东西自然都会来的。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步