//IRegex 的属性与方法 
IRegex.GetGroupNames;         { 子表达式编号数组, 譬如有两个子表达式, 会得到 0,1,2; 这基本无用 }
IRegex.GetGroupNumbers;       { 同上, 只是获取的是整数数组 }
IRegex.GroupNameFromNumber(); { 应该是从子表达式编号获取子表达式的名称; 但没有实现, 来回都是编号 }
IRegex.GroupNumberFromName(); { 同上一个是反着的; 基本都无用 }
IRegex.IsMatch();             { 判断是否有所匹配; 如果只想知道是否匹配到, 用它应该最快 }
IRegex.Match();               { 获取一个 IMatch 对象, 这是第一个匹配结果 }
IRegex.Matches();             { 获取一个 IMatchCollection 对象; 这是匹配到的 IMatch 的集合 }
IRegex.Replace();             { 替换 }
IRegex.Split();               { 根据表达式分割字符串; 当前版本没有实现好, 暂时无用 }
IRegex.ToString;              { 获取表达式文本 }
IRegex.Save();                { 把表达式保存到流 }
IRegex.Load();                { 从流中取回由 Save 保存的表达式 }
IRegex.Options;               { 选项集合, 是只读的; 要设置只能从 Create 方法中 }
{这其中需要重新看看的只有 Replace}

//IRegex 是通过 TRegex 实现的, TRegex 还有下面几个静态类方法:
TRegex.Escape();    { 编码需要转义的字符 }
TRegex.Unescape();  { 还原 Escape 的编码 }
TRegex.IsMatch();   { 同 IRegex.IsMatch }
TRegex.Match();     { 同 IRegex.Match }
TRegex.Matches();   { 同 IRegex.Matches }
TRegex.Replace();   { 同 IRegex.Replace }
TRegex.Split();     { 同 IRegex.Split }
{ 使用这些个类方法会让代码更简单 }


下面是使用类方法简化程序的例子:
uses RegularExpressions;

procedure TForm1.FormCreate(Sender: TObject);
var
  Match: IMatch;
  MatchCollection: IMatchCollection;
  Pattern, Input, str: string;
begin
  Pattern := '([A-Za-z]+)(\d+)';
  Input := 'AAA1 BBB2 AA11 BB22 A111 B222 AAAA';

  //
  Match := TRegex.Match(Input, Pattern);
  ShowMessage(Match.Value); { AAA1 }

  //
  MatchCollection := TRegex.Matches(Input, Pattern);
  ShowMessage(IntToStr(MatchCollection.Count)); { 4 }
  
  //
  str := TRegex.Replace(Input, Pattern, '◆');
  ShowMessage(str); { ◆ ◆ ◆ ◆ ◆ ◆ AAAA }
end;


Escape 与 Unescape 测试:
uses RegularExpressions;

procedure TForm1.FormCreate(Sender: TObject);
var
  str: string;
begin
  str := TRegex.Escape('.$^{[(|)*+?\');
  ShowMessage(str);  (* \.\$\^\{\[\(\|\)\*\+\?\\ *)
  str := TRegex.Unescape(str);
  ShowMessage(str);  (* .$^{[(|)*+?\ *)
end;


Replace 函数有很多重载, 如:
uses RegularExpressions;

procedure TForm1.FormCreate(Sender: TObject);
var
  Regex: IRegex;
  Match: IMatch;
  Pattern, Input, str: string;
begin
  Pattern := '([A-Za-z]+)(\d+)';
  Input := 'AAA1 BBB2 AA11 BB22 A111 B222 AAAA';
  Regex := TRegex.Create(Pattern);

  { 替换全部 }
  str := Regex.Replace(Input, '◆'); 
  ShowMessage(str); { ◆ ◆ ◆ ◆ ◆ ◆ AAAA }

  { 只替换前两个匹配 }
  str := Regex.Replace(Input, '◆', 2);
  ShowMessage(str); { ◆ ◆ AA11 BB22 A111 B222 AAAA } 

  { 从第 10 个字符开始, 只替换两个匹配 }
  str := Regex.Replace(Input, '◆', 2, 10);
  ShowMessage(str); { AAA1 BBB2 ◆ ◆ A111 B222 AAAA } 
end;


Replace 函数中还应该有一个 TMatchEvaluator 事件参数, 它可以执行一些更高级的替换, 遗憾的是当前版本也没有实现.

尽管有不少东西还没实现, 但试用下来感觉还是蛮不错的, 可以放弃 PerlRegEx 了!

posted on 2010-01-07 13:31  万一  阅读(3041)  评论(0编辑  收藏  举报