使用正则表达式替换多组文字

如何使用正则表达式简洁处理一篇文章中出现的若干敏感词汇,将出现的敏感词汇使用下划线连接?

敏感词汇可能有多组,每组出现的次数也是随机的。

比如这样一篇文章

博客园有很多好的博文。

假设敏感词汇博客园、博客。

处理之后

博_客_园有很多好的博_文。

正则表达式为我们提供了便捷的方法。

Regex.Replace(input, rules,new MatchEvaluator(delegate(Match m){
   if (string.IsNullOrEmpty(m.Value) || 
    m.Value.ToCharArray().Length == 0) return string.Empty;
   return string.Join("_", m.Value.ToCharArray());
}));

第一个参数是检索的文章。

第二个参数是匹配规则,同时支持多种查找,中间使用|。如博客园|文章。

第三个是一个自定义方法,用于处理匹配到数据。

在上例中,rules:博客园|文章

delegate会执行两次。第一次匹配到的是博客园,第二次是文章。

 

posted on 2015-04-07 15:46  lucika.zh  阅读(1095)  评论(0编辑  收藏  举报

导航