c# 使用正则表达式对字符串进行处理

项目里需要对从文本文件里读入的字符串数据进行处理,数据格式大致是这样的:

[a,b]<x,y,z>A<x,y,z>B<x,y,z>, 其中a,b,x,y,z分别代表不同的数字。

希望处理后的数据格式如下:

 [a,b]<x,y>A<x,y>B<x,y> 就是去掉<x,y,z>里的,z

一开始考虑string的split函数逐行处理,发现代码写起来比较繁琐。

后来发现用Regex处理代码非常精简,只是正则表达式的设计比较复杂。

 下面给出关键代码:

public string Format(string str)
{
    Regex rex = new Regex(@"<(\d+),(\d+),(\d+)>");
    return rex.Replace(str, "<$1,$2>");

其中正则表达式"<(\d+),(\d+),(\d+)>"用来匹配<x,y,z>格式

 rex.Replace(str, "<$1,$2>");

这句表示用上述正则表达式去查找匹配str,如果找到,则将其替换为<$1,$2>,其中$1,$2分别表示匹配结果中的的第一个、第二个元素(第0个元素是完整的匹配结果),如查找到<x,y,z>, 则$1=x, $2=y

这样短短2行代码就实现了复杂的功能,正则表达式果然是非常强大。 

(Regex在System.Text.RegularExpressions命名空间里,别忘了using;)

posted @ 2012-02-23 23:00  icecryed  阅读(852)  评论(0编辑  收藏  举报