python3.3制作的网页图片抓取
//url.txt中保存的是网页的源代码 因为3.3中的正则findall(re,str) 后面是str 如果使用urlopen(url).read()得到是一个like bites-type的类findall无法使用
但是在python2.?中可以,一时找不到方法,就换用闲保存在txt中 在读出
import re
import urllib.request
urlfile = open("d:\\url.txt",'r')
urllist = re.findall(r'src="(htt.*\.jpg)',urlfile.read())
x = 0
for url in urllist:
print(url)
print('\n')
urllib.request.urlretrieve(url,'%s.jpg'%x)
x+=1