python爬取网页图片

# html:网页地址
def getImg2(html):
    soup = BeautifulSoup(html, 'html.parser')
    href_regex = re.compile(r'^http.*?(jpg|png)')
    imgurlset = set()
    item = soup.find_all('img', {'data-original': href_regex})
    for a in item:
        if 'data-original' in a.attrs:
            imgurlset.add(a.attrs['data-original'])
    x = 0    
    for url in imgurlset:
        print(url)
        # 下载图片
        urllib.request.urlretrieve(url, 'F:\\img\\%s.jpg' % x)
        x += 1

posted @ 2019-05-30 16:24 洛洛沙阅读(496) 评论(0) 编辑收藏举报

指间灵动，快码加编

刷新页面返回顶部

洛洛沙

python爬取网页图片

公告