let it be
行到水穷处 坐看云起时
  使用Regex.Replace()方法可以剔除字符串中的HTML代码,例如在text数据类型的数据库字段,中存放的字符串格式如下:<DIV><B><FONT color=blue><FONT size=2>一、学术研究课题</FONT></FONT></B></DIV>
如果这段字符串不经过处理显示出来就是加粗的字体,如下:“一、学术研究课题

如果现在想更改这个字符串显示的格式,将字号设置成13px,颜色设置成黑色。那要怎么做?
在这个时候可以使用Regex.Replace()方法,并且配合使用正则表达式来实现。

在使用这个方法之前首先要在命名控件中添加以下引用:using System.Text.RegularExpressions;
这个是Regex的命名空间。

首先声明string str字符串变量,str的值如下:str=<DIV><B><FONT color=blue><FONT size=2>一、学术研究课题</FONT></FONT></B></DIV>

首先替换掉<B>(粗体)得到如下格式的字符串:<DIV><FONT color=blue><FONT size=2>一、学术研究课题</FONT></FONT></DIV>

方法:str = Regex.Replace(str, @"<B[\s\S]*?>([\s\S]*?)</B>", "$1", RegexOptions.IgnoreCase);

其次替换掉<FONT color=blue><FONT size=2>(字体的颜色和大小),得到如下格式的字符串:<DIV>一、学术研究课题</DIV>

方法:        
      str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
      str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
注意:在此使用两个Replace方法,是因为在字符串中有两个FONT,每次替换掉一个,感觉此处很麻烦,如果有多个FONT那怎么办那?这个问题仍然在思考中......也敬请指教!

最后为这个替换过的字符串添加上自己设置的格式(行高15px,字号13px,颜色黑色):
方法如下:
str = "<font style=" + "line-height:15px;font-size:13px;color:#000000" + ">" + str + "</font>";

整体过程写成函数如下:
    public string cleartag(string str)
    {
        str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
        str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
        str = Regex.Replace(str, @"<B[\s\S]*?>([\s\S]*?)</B>", "$1", RegexOptions.IgnoreCase);
        str = "<font style=" + "line-height:15px;font-size:13px;color:#000000" + ">" + str + "</font>";
        return str;
    }

这是本人在做开发的过程中遇到的一个问题,以及自己的解决方法,如果有什么好的方法请大家在此留言指教!
站在08年的门槛上期待大家的评论留言。

在此给大家另外一个博友的文章,代码格式化,也是使用的Replace()方法和正则表达式,希望对大家有用。

http://www.cnblogs.com/twh/archive/2007/12/18/1004789.html



posted on 2007-12-27 15:51  流浪浪  阅读(10065)  评论(11编辑  收藏  举报