博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

实例练习:正则表达式爬取百度贴吧照片

  代码出自小甲鱼,复盘,省略了图片的下载部分

  正则真的太好用了,不过关键在你想不想的到最高效的正则表达式

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 import urllib.request
 4 import re
 5 
 6 url = "https://tieba.baidu.com/p/6512141636"
 7 
 8 def web(url):
 9     response = urllib.request.urlopen(url)
10     html = response.read().decode('UTF-8','ignore')
11     test = r'<img class="BDE_Image" src="([^"]+\.jpg)"'
12     out = re.findall(test,html)
13     print(out)
14 web(url)

 

posted @ 2020-02-25 21:35  EliotShen  阅读(338)  评论(0编辑  收藏  举报