摘要: 今天再爬虫的正则表达式里纠结了很久,记录下来,防止忘记再浪费时间 content = requests.get(url) m=re.findall(r'<a href=\"([0-9a-zA-Z\_\/\.\%\?\=\-\&]+)\"',content.text,re.I)要匹配href=" "中 阅读全文
posted @ 2019-11-29 22:43 Crays-Zhang 阅读(103) 评论(0) 推荐(0) 编辑