js 正则匹配（去掉html标签）

原文地址：http://cgxcn.blog.163.com/blog/static/1323124220095384043365/

js 正则匹配（去掉html标签）

1，得到网页上的链接地址：

string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2，得到网页的标题：
string matchString = @"<title>(?<title>.*)</title>";
3，去掉网页中的所有的html标记：
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档

4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html标记的函数：
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

完

posted @ 2011-08-02 19:34 wangkangluo1 阅读(62124) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部