python3.3制作的网页图片抓取

//url.txt中保存的是网页的源代码 因为3.3中的正则findall(re,str) 后面是str 如果使用urlopen(url).read()得到是一个like bites-type的类findall无法使用

但是在python2.?中可以,一时找不到方法,就换用闲保存在txt中 在读出

import re
import urllib.request
urlfile = open("d:\\url.txt",'r')
urllist = re.findall(r'src="(htt.*\.jpg)',urlfile.read())
x = 0
for url in urllist:
        print(url)
        print('\n')
        urllib.request.urlretrieve(url,'%s.jpg'%x)
        x+=1

posted @ 2013-08-11 16:50  明明就是我  阅读(320)  评论(0编辑  收藏  举报