python3抓取超链接

import re
import urllib.request
#(http://\S*?)[\"] 提取不带"
#http://\S*?[\"] 提取的时候带"
#\S非空字符 *0-多个 ?非贪婪 \"|>|)三个符号其中之一为结束
httpre=re.compile(r"(http://\S*?)[\"|>|)]",re.IGNORECASE)
for line in urllib.request.urlopen("http://www.baidu.com"):
line=line.decode("utf-8")
mylist = httpre.findall(line)
if mylist:
print(mylist)

posted on 2017-11-07 23:50  888ewe  阅读(91)  评论(0)    收藏  举报

导航