正则表达式的威力--轻松消除HTML代码

      正则表达式再次让我震撼,寥寥数行代码就可以完成普通代码不易实现的功能,至少是实现起来比较复杂的功能。

一、清楚内容中的Javsscript 代码

 1 Function ClearJSCode(originCode)
 2 
 3   Dim reg
 4 
 5   set reg = New RegExp
 6 
 7   reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
 8   reg.IgnoreCase = True
 9   reg.Global = True
10 
11   clearJSCode = reg.Replace(originCode, "")
12 
13 End Function
14 

 二、清除内容中的HTML代码

 1 Function ClearHTMLCode(originCode)
 2 
 3     Dim reg 
 4     set reg = new RegExp 
 5 
 6     reg.Pattern = "<[^>]*>"
 7     reg.IgnoreCase = True
 8     reg.Global = True
 9  
10     ClearHTMLCode = reg.Replace(originCode, "")
11 
12 End Function
13 


现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。
posted @ 2007-09-14 23:03  meil  阅读(4483)  评论(1编辑  收藏  举报