\ 转义字符 如:要使用 “\” 本身, 则应该使用“\\” \t Tab制表符 注:扩展和正则表达式都支持 \r 回车符CR 注:扩展支持,正则表达式不支持 \n 换行符LF 注:扩展支持,正则表达式不支持 . 匹配任意一个字符 ^ 其右边的表达式被匹配在行首。如:^A匹配以“A”开头的行 $ 其左边的表达式被匹配在行尾。如:e$匹配以“e”结尾的行 | 或运算符,匹配表达式左边和右边的字符串。如:ab|bc匹配“ab”或“bc” [] 匹配列表中任意单个字符。如:[ab]匹配“a”或“b”;[0-9]匹配任意单个数字 [^] 匹配列表之外的任意单个字符。如:[^ab]匹配“a”和“b”以外的单个字符;[^0-9]匹配任意单个非数字字符 * 其左边的字符被匹配任意次(0次或多次)。如:be*匹配“b”,“be”或“bee” + 其左边的字符被匹配至少一次(1次或多次)。如:be+匹配“be”或“bee”,但不匹配“b” ? 其左边的字符被匹配0次或者1次。如:be?匹配“b”或“be”,但不匹配“bee”;\r?\n匹配行结尾符 () 影响表达式匹配的顺序(类似C++的小括号会影响表达式运算顺序),并且用作表达式的分组标记(标记从1开始)如:([a-z]bc)smn\1匹配“tbcsmntbc”;另见:看下文的示例 {} 指定前面的字符或分组的出现次数 如:abc{3}匹配abccc;a(bc){2}匹配abcbc \d 匹配一个数字字符。等价于:[0-9] \D \d取反,匹配一个非数字字符。等价于:[^0-9] \s 匹配任意单个空白字符:包括空格、制表符等(注:不包括换车符和换行符)。等价于:[ \t] \S \s取反的任意单个字符。 \w 匹配包括下划线的任意单个字符。等价于:[A-Za-z0-9_] \W \w取反的任意单个字符。等价于:[^A-Za-z0-9_] \b 匹配单词起始处或结尾处 如:\bin匹配int,但不匹配sing
?i : 匹配时不区分大小写 ?s : 单行模式,表示更改.的含义,使它与每一个字符匹配(包括换行 符\n) ?m : 多行模式,表示更改^和$的 含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。(在此模式下,$的 精确含意是:匹配\n之前的位置以及字符串结束前的位置.) ^ : 一行的开始 $ : 一行的结束 . : 任意字符类 [abc] : 包含a、b和c的任何字符(tong a|b|c) [^abc]: 除a、b和c的任何字符 \s : 空白符 \S : 非空白符 \d : 数字[0-9] \D : 非数字[^0-9] \w : 词字符[a-zA-Z0-9] \W : 非次字符 贪婪型 勉强型 占有型 如何匹配 X? X?? X?+ 一个或零个X X* X*? X*+ 零个或多个X X+ X+? X++ 一个或多个X X{n} X{n}? X{n}+ 恰好n次X X{n,} X{n,}? X{n,}+ 至少n次X X{n,m} X{n,m}? X{n,m}+ X至少n次,且不超过m次
去除重复行正则表达式
^(.*?)$\s+?^(?=.*^\1$)
格式化保存的页面代码
搜索 ^.*?([0-9]+\.).*?href="(.*?)".*?>(.*?数.*?)<.*?$
替换 \1\3\n\2\n\n\n
[^\x00-\xff]匹配汉字 ([^\x00-\xff]|\w|-) 匹配汉字 字母 数字 - 下划线_ (\s|[\r\n]) 匹配空格 换行 回车符
表格数据转实体类字段
匹配任意一行
(?i)(?s)^([a-z]+)\s+\[?([a-z0-9\<\>\!]+)\]?\s+(.*?)$
转换成类字段
/** \3 */\r\nprivate \2 \1;