更多正则符号参考:https://www.jb51.net/tools/regex.htm
1、基本符号
元字符:“+”, “*”,“?”
*:匹配前面的子表达式零次或多次
+:匹配前面的子表达式一次或多次
?:匹配前面的子表达式零次或一次
次数限定符:
{n}:n是一个非负整数。匹配确定的n次;o{2} 只能匹配 oo
{n,}:n是一个非负整数。至少匹配n次;o{2,} 能匹配 oo 或 fooood中的多个o
{n,m}:m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次;o{1,3} 能匹配 1个、2个或3个 o
贪婪与非贪婪限定符:
贪婪限定符会尽可能多的匹配文字,只有在它们的后面加个一个"?"就可以实现非贪婪或最小匹配
特殊字符:
“^”定位符规定匹配模式必须出现在目标字符串的开头
“$”定位符规定匹配模式必须出现在目标对象的结尾
“\b”定位符规定匹配模式必须出现在目标字符串的开头或结尾的两个边界之一
“\B”定位符则规定匹配对象必须位于目标字符串的开头和结尾两个边界之内,即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾。
\w:匹配包括下划线的任何单词字符。. 类似但不等价于“ [A-Za-z0-9_]”,这里的"单词"字符使用Unicode字符集;
\W:匹配任何非单词字符。. 等价于“ [^A-Za-z0-9_]”;
\s:用于匹配单个空格符,包括tab键和换行符;
\S:用于匹配除单个空格符之外的所有字符;
\d:用于匹配从0到9的数字;
\D:匹配所有的非数字字符
. :用于匹配除换行符之外的所有字符;
参考:
https://blog.csdn.net/baple/article/details/18327317
https://blog.csdn.net/wl_ss/article/details/78241782
2、删除代码中的注释
// 单行注释
/* */ 多行注释
/** */ 文档注释
删除 java 注释 /* */:
/\*{1,2}[\s\S]*?\*/
删除 java 注释 //:
//[\s\S]*?\n
删除xml注释:
<!-[\s\S]*?-->
删除空白行:
^\s*\n
\n或者是\r\n 或者是\r 都可能是换行符,要看你的系统是windows还是Unix/Linux或者是mac的系统
作者:西伯尔
出处:http://www.cnblogs.com/sybil-hxl/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。