python常见示例->web简单示例
比如你抽取右边的活动
代码段如下:
import re #正则类 from urllib import urlopen #提取内容类 #打开链接 webpage = urlopen("http://www.douban.com") #提取读取内容 info = webpage.read() #正则匹配 party = re.findall("<a.href=\"http://www.douban.com/online/[0-9]+.\">(.{1,50})</a>",info) if len(party)>0: for x in xrange(len(party)):print party[x]
效果如下: