代码改变世界

RegExp正则表达式心得 1 -分解MIME格式

2004-05-25 13:36  灵感之源  阅读(2046)  评论(0编辑  收藏  举报

最近在研究RegExp正则表达式,以下是心得:

在写OpenPOP.NET的过程中,我遇到了需要对MIME进行解析,我研究了一下,得到如下结果:

表达式:(分组) "\=\?(?<Charset>\S+)\?(?<Encoding>\w)\?(?<Content>\S+)\?\="

代码:

  public string DecodeTextRegEx3(string strSrc)
  {
   string strRet="";
   string[] strParts=Regex.Split(strSrc,"\r\n");
   Match m=null;

   for(int i=0;i<strParts.Length;i++)
   {
    m = Regex.Match(strParts[i], @"\=\?(?<Charset>\S+)\?(?<Encoding>\w)\?(?<Content>\S+)\?\=");
    if(m.Success)
    {
     strRet+=m.Groups["Charset"].Value;
     MessageBox.Show(this, "Charset="+m.Groups["Charset"].Value);
    }
    else
    {
     strRet+=strParts[i];
     MessageBox.Show(this,strParts[i]);
    }
   }
   return strRet;
  }

运行以上代码便可得到结果。

说明:Charset是语言编码,Encoding是MIME编码,Content是内容。具体内容解码请参看OpenPOP.NET