perl的正则表达式

2015-01-25 16:00 Ansersion 阅读(2290) 评论(0) 收藏举报

“小骆驼”的“正则表达式“部分学习总结：

一、匹配语法：

1、"."：任意单字符（‘\n‘除外）；

2、“*“：匹配前项0～n次；

3、“+“：匹配前项1～n次；

4、“?”：匹配前项0～1次；

5.1、“\1"或"\2“：反向引用；

5.2、“\g{N}"：方向引用，如果N为负数，则为相对反响引用；

6、“|”：“或“匹配（注意左边的条件可以屏蔽右边的条件）；

7.1、“[]”：字符集单一字符匹配；

7.2、"[^]“：反向字符集单一字符匹配；

8.1、“\d"：[0-9]（反向匹配："\D"）；“[\d\D]"：任意字符（包括‘\n‘）；

8.2、“\w"：[A-Za-z0-9_]（反向匹配："\W"）；

8.3、"\s"：[\f\t\n\r ]（反向匹配："\S"）；(注意最后有空格)；

8.4、"\h"：[\t ]；（匹配横向空白，注意最后有空格）

8.5、"\v"：[\f\n\r]；（匹配纵向空白）

8.6、“\R"：跨造作系统断行匹配；

9、"//"或“m//"或“m<>"或“m%%"等等：模式匹配；

10.1、“/i"：大小写无关修饰符；

10.2、“/s"：使能“."匹配'\n'修饰符；

10.3、“/x"：忽略模式空白与注释（‘#‘后部分）；

11.1、“^"：行首锚位；

11.2、“$"：行尾锚位；（“\^\s*$\“：匹配任意空白行）

11.3、“\b“：单词锚位（以‘\w‘为准，方向匹配\B）；("\bansersion"和“\bansersion\B"匹配：ansersiona, ansersion__ab134，但前者匹配ansersion，后者则不匹配)

12、“=~"：绑定操作；

13、"($val)"：使用变量；

14.1、“$1"或"$2"等等："()"模式捕获变量；

14.2、“(?:xxx)"：不捕获“xxx"之“$n"中，仅做分组；

14.3、“(?<label>xxx)"：标签捕获，捕获结果位于“%+“中，引用key为“label"；（方向引用“\1“和"\g{1}"需更改为\g{label}或\k<label>）（perl 5.010特性）

14.4、“ $`; $&; $' "：匹配字符串之前部分；匹配字符串部分；匹配字符串之后部分；

15、"{a}; {a,b}; {a,}"：匹配a次；匹配a到b次；匹配a及a以上次；（无"{,b}"，否则任意字符串会匹配成功——匹配0次）

16、"*?"; "+?"; "{a,}?", "{a,b}?"：量词的“非贪婪匹配“，即通过递增索引来匹配（常规情况为“贪婪匹配“，即通过递减来匹配）；

17、(?=exp);(?<=exp);(?!exp);(?<!exp)：零宽断言。

二、处理语法

1、"s/a/b/"：b替换首次出现的a；

2、“s/a/b/g"：b替换全部的a；

3、界定符说明：“s/a/b/"，“s{a}{b}"，“s[a](b)"，“s<a>#b#"，及其它等效；

4、修饰符："\g"全局替换，"\i"，“\x"等同“匹配语法”；"/m"多行匹配；

5、绑定操作：同“匹配语法”；

6、大写转换：\U：后续字符串大写替换。"s/(a)/\U$1/"，"s/(a)/\U$1\Exxx/"（“\E“取消“\U”对xxx影响）；“\u“单一字符大写替换：s/(a)/\u\L$1/ig（首字母大写）；

7、小写转换：\L；\l同“大写转换“；

8、字符串分割(split)：@fields = split /separator/, $string；

9、字符串拼接(join)：my $result = join $glue, @pieces；（@pieces必须含2个或2个以上元素）

三、其他

1、优先级：

2、测试程序：

#!/usr/bin/perl

while(<>) {
         chomp;
          if(/YOUR_PATTERN_GOES_HERE/) {
                 print "Matched: |$`<$&>$'|\n";
          } else {
                 print "No match: |$_|\n";
         }
}

3、常用字符串匹配与处理：

（1）提取字符串字母部分：

my @words = ($text =~ /([a-z]+/g);

my $result = join "", @words;

（2）提取记录hash：

my %students = ($text =~ /(?<ID>\w+)\s+(?<Name>\w+)/g);

刷新页面返回顶部

Ansersion

perl的正则表达式

About