简谈-如何将图片下载到本地

得到图片的网址之后我么你怎么将图片下载到本地呢？
在python中我们使用 urllib 库里面的 urllib.urlretrieve() 函数
又是新函数，还记得上回在使用urllib2.Request() 函数的时候因为传参数时没指定好参数名，所以运行出现了一个错误，这回要吸取教训，先把函数原型搞清楚
要弄清出函数原型，我目前为止用到的有两种方法：
1. 使用python自带的help函数 help(urllib.urlretrieve)
2. 在/usr/lib/python2.7 中找到 python 的库文件查看里面的函数（linux系统）

这是输出结果
　　1. url 是你要传入的下载链接
　　2. finename 指定了保存本地路径(如果参数未指定，urllib会生成一个临时文件保存数据）
　　3. reporthook 是一个回调函数，当连接上服务器、以及相应的数据块传输完毕时会触发该回调，我们可以利用这个回调函数来显示当前的下载进度
　　4. data 指 post 到服务器的数据
现在我们暂时还用不到后面的两个参数，所以只需要记住前面两个参数是url，和filename 就行了
下载图片的源码很简单，为了让大家更好的理解，我这里直接将图片网址作为URL来进行下载
　　#!/usr/bin/env python
　　# -*- coding: UTF-8 -*-
　　__author__ = '217小月月坑'
　　import urllib
　　url = 'http://gtd.alicdn.com/sns_logo/i3/TB1lln8KpXXXXazXFXXwu0bFXXX.png_60x60.jpg'
　　path = '/home/ym/pics/picture'
　　# 注意，这里的path写的是文件名，包括文件的路径和名字
　　urllib.urlretrieve(url,path)下载一张图片很简单吧，现在我们来试着下载这个网页上的所有图片，代码如下
　　#!/uer/bin/env python
　　# -*- coding: UTF-8 -*-
　　__author__ = '217小月月坑'
　　'''
　　将网页上的图片下载到本地
　　'''
　　import urllib
　　import urllib2
　　import re
　　url = 'http://product.yesky.com/more/506001_31372_photograph_1.shtml'
　　user_agent = 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:40.0) Gecko/20100101 Firefox/40.0'
　　headers = {'User-Agent':user_agent}
　　i = 0
　　try:
　　request = urllib2.Request(url,headers=headers)
　　response = urllib2.urlopen(request)
　　conents = response.read().decode("gbk")
　　# 使用RE获取图片的网址
　　pattern = re.compile(r'<img src="(.*?)".*?',re.S)
　　# 返回包含图片网址的列表
　　items = re.findall(pattern,conents)
　　for item in items:
　　# 设置图片的路径和名字
　　path = r'/home/ym/pics/'+str(i)
　　i+=1
　　# 下载图片
　　urllib.urlretrieve(item,path)
　　print "图片"+path+"下载完成！"
　　except urllib2.URLError,e:
　　if hasattr(e,"code"):
　　print e.code
　　if hasattr(e,"reason"):
　　print e.reason
　　输出的结果：

posted @ 2017-04-22 20:32 zhongchangcai 阅读(1014) 评论(0) 收藏举报

刷新页面返回顶部

zhongchangcai

简谈-如何将图片下载到本地

公告