获取网站所有的url正则表达式

C#
string pattern1 = @"(?is)<[^>]*?src=(['""\s]?)(?<src>[^'""\s]*)\1[^>]*?>";
string pattern2 = @"(?is)<[^>]*?href=(['""\s]?)(?<href>[^'""\s]*)\1[^>]*?>";
  

python:

pattern1 =r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')"
pattern2 =r"(?<=src=\").+?(?=\")|(?<=src=\').+?(?=\')"

  




posted @ 2018-01-16 22:41  公众号python学习开发  阅读(332)  评论(0编辑  收藏  举报