获取连接根地址
(?:http|ftp|https)://(?:(?:[^/]*/)+(?=\w*\.{1}))|(?:http|ftp|https)://(?:[^/]*/?)+
获取src标签内的内容
(?<=src\s*=\s*\")[^\s\"]*(?=\"?)
获取连接带连接属性
(?:(?:src|href|url)\s*=[\s"']?)(?=[\s"'])?[^\s"'>]*(?:[\s"']?)
获取是相对连接的连接
(?<=(?:src|href|url|background)\s*=\s*["']?)(?=[\s"']?)(?!(?:http://|/|#))([^\s"'>]*)
获取是相对根的连接
(?<=(?:src|href|url)\s*=[\s"']?)(?=[\s"'])?(?!http://)(?=/)([^\s"'>]*)
获取指定标签的指定属性
(?<=<(?:img)[^>]*(?<start>(?:src)(?:\s*=\s*(?<end>["']?))))(?:[^\s"'>]*)
上面是判断图片的连接地址的如果需要判断数据类型加
(?=(?:jpg|gif|jpeg|bmp|png))
用于替换相对连接为绝对连接(.net推荐)
表达式:
(?<=(?<start>(?:src|href|url|background)(?:\s*=\s*(?<end>["']?)))(?! http://|/|#|javascript))(?:[^\s"'>]*)
更新:
text.replace(group["start"] + match + group["end"], group["start"] + insertString + match + group["end"])
用于替换相对根地址为绝对地址
(?<=(?<start>(?:src|href|url|background)(?:\s*=\s*(?<end>["']?)))(?=/))(?:[^\s"'>]*)
text.replace替换
text.replace(group["start"] + match + group["end"], group["start"] + insertString + match + group["end"])
Flash的连接地址:
(?<=param\s*name="movie"\s*value=["']?)(?:\s*|.)*[^>]*>
(?<=(?<start>(?:<param[^>]*movie[^>]*value)(?:\s*=\s*(?<end>["']?)))(?!http://|/))(?: [^\s"'>]*)
获取合法的财务数字
(^-?(?:(?:\d{0,3}(?:,\d{3})*)|\d*))(\.\d{1,2})?$
获取合法电话号码
^(?:[0-9]?[0-9]{2,3}-)?[0-9]{7,8}$|0?13[0-9]{9}
获取网址的基域名
http://www.csdn.net 获取 csdn.net
(?<=(?:://\w+\.)?)(?:\w+\.)(?:com\.cn|net\.cn|org\.cn|com|net|org|cn|biz|info|cc|tv)
这个没用
<(?:msii)[^>]*(?:(id|value|style)(?:\s*=\s*(?:["']?)([^"'\s]*)))[^>]+(?:(id|value|style) (?:\s*=\s*(?:["']?)([^"'\s]*))[^>]+(?:(id|value|style)(?:\s*=\s*(?:["']?)([^"'\s]*))))(?: [^/>]*)(?:/>|>(?<innerhtml>(?:\s+|.)*?)</msii>)