正则表达式你了解多少？（文末附小测验题）

声明：本文版权归作者和博客园共有，欢迎转载。但必须保留此段声明，且在文章页面明显位置给出原文连接

正则表达式（Regular Expression，通常简写为Regex或RE），又称规则表达式。

正则表达式是对字符串进行过滤的一种公式，主要由具有特定意义的字符组成。我们一般把这种特定意义的字符称为元字符。正则表达式通常被用来检索或替换符合某个规则的文本。

那么常见的元字符有哪些呢？在我这里把常见的元字符归为以下几组：

第一组：格式组（匹配换行、回车等格式类符号）

比如替换掉下面中的换行符：

第二组：叫板组（你说A，我就偏不说A）

当然他们之间也可以组合起来，比如其中的\s和\S组合起来：[\s\S]，就是匹配所有字符，其他组类似。

第三组：限定组（限定匹配的次数）

比如匹配4个数字：

第四组：位置组（表示符号的位置）

元字符	解释说明
\b	表示单词的开始或结尾位置（注意只表示位置，不代表任何字符）
\B	表示非单词的开始或结尾位置（同上）
^	表示字符串的开始位置（同上）
$	表示字符串的结尾位置（同上）

比如匹配以0结尾的数据：

第五组：断言组（假设满足一定的条件）

比如匹配abc的所有字符：

第六组：子表达式及其他组（和子表达式相关的，以及其他常用的元字符）

元字符	解释说明
()	通常表示一个完整的表达式（也叫做子表达式），可将匹配的内容保存下来，以供后续使用
\1	引用前面第1个子表达式保存的文本，\2\3\4...同理
\|	表示或的关系，比如a\|b表示a或者b
\	转义字符，比如\\n表示匹配\n这个符号

比如删除下面字符中的重复项：

小测验

在EXCEL中使用正则表达式对字符串：“单芯片,双芯片,单芯片,双芯片,四芯片,单芯片”进行删除重复项：“双芯片,四芯片,单芯片”。（还不知道怎么在Excel里使用正则表达式请移步下方公众号）

欢迎大家在下方留言您的答案，当然，如果您对我的答案感兴趣，请在公众号后台回复：正则小测验

posted on 2021-05-22 23:52 徐-清风阅读(449) 评论(0) 收藏举报