js正则匹配html内容

1.得到网页上的链接地址：

string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";

2.得到网页的标题：

string matchString = @"<title>(?<title>.*)</title>";

string matchString = @"<title>([\S\s\t]*?)</title>";

3.去掉网页中的所有的html标记：

string temp = Regex.Replace(html, "<[^>]*>", "");

4.js去掉所有html标记的函数：

function delHtmlTag(str)
{
　　return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

posted @ 2016-05-16 16:50 姑苏慕容复阅读(6409) 评论(0) 编辑收藏举报

刷新页面返回顶部