用python3.3爬取图片
这篇文章是看了网上有人写了之后,才去试试看的,但是因为我用的是python3.3,与python2.x有些不同,所以就写了下来,以供参考。
get_webJpg.py
1 #coding=utf-8 2 import urllib.request 3 import re 4 5 def getHtml(url): 6 html = urllib.request.urlopen(url).read() 7 return html 8 9 def getImg(html): 10 reg = r'src="(.+?\.jpg)" pic_ext' #正则表达式 11 imgre = re.compile(reg) 12 imglist = re.findall(imgre, html) 13 14 x = 0 15 for imgurl in imglist: 16 urllib.request.urlretrieve(imgurl,'%s.jpg' %x) 17 x += 1 18 19 #return imglist 20 21 html = getHtml("http://tieba.baidu.com/p/2460150866").decode('utf8') 22 print(getImg(html))
结果就是把网上那些图片下载到与get_webJpg.py同一个目录下了: