javaScript 正则表达式 去除字符串中的所有空格和标点符号
1 正则表达式中特殊字符的含义
^ 匹配一个输入或一行的开头,/^a/匹配"an A",而不匹配"An a"
$ 匹配一个输入或一行的结尾,/a$/匹配"An a",而不匹配"an A"
* 匹配前面元字符0次或多次,/ba*/将匹配b,ba,baa,baaa
+ 匹配前面元字符1次或多次,/ba*/将匹配ba,baa,baaa
? 匹配前面元字符0次或1次,/ba*/将匹配b,ba
(x) 匹配x保存x在名为$1...$9的变量中
x|y 匹配x或y
{n} 精确匹配n次
{n,} 匹配n次以上
{n,m} 匹配n-m次
[xyz] 字符集(character set),匹配这个集合中的任一一个字符(或元字符)
[^xyz] 不匹配这个集合中的任何一个字符
[\b] 匹配一个退格符
\b 匹配一个单词的边界
\B 匹配一个单词的非边界
\cX 这儿,X是一个控制符,/\cM/匹配Ctrl-M
\d 匹配一个字数字符,/\d/ = /[0-9]/
\D 匹配一个非字数字符,/\D/ = /[^0-9]/
\n 匹配一个换行符
\r 匹配一个回车符
\s 匹配一个空白字符,包括\n,\r,\f,\t,\v等
\S 匹配一个非空白字符,等于/[^\n\f\r\t\v]/
\t 匹配一个制表符
\v 匹配一个重直制表符
\w 匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如[\w]匹配"$5.98"中的5,等于[a-zA-Z0-9]
\W 匹配一个不可以组成单词的字符,如[\W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]。
特殊字符大全完整引用见:https://www.jb51.net/article/43190.htm
2 正则表达式的使用
var expression = /pattern/flags; var expression = new RegExp("pattern",["flags"])
pattern:可以是任何简单或复杂的正则表达式。
flag:标志,每个正则表达式都可带有一或多个标志,用来标明正则表达式的行为。
· 正则表达式的匹配模式支持下列三个标志:
g: 表示全局(global)模式,即模式将被应用于所有字符串,而非在发现第一个匹配项时立即停止;
i: 表示不区分大小写(case-insensitive)模式,即在确定该匹配项时忽略模式与字符串的大小写;
m: 表示多行(multiline)模式,即在到达一行文本末尾时还会继续查找下一行中是否存在于模式匹配的项。
//匹配第一个"bc"或"cat",不区分大小写 var pattern1 = /[bc]at/i; //与pattern1相同,只不过是使用构造函数创建的 var pattern2 = new RegExp("[bc]at", "i");
3 去除字符串中所有空格和标点符号,并拓展判断回文串
实现这个功能,可以从反方向思考,不是直接去除所有标点符号,而是匹配非数字和大小写字符的其他字符,然后用“”替换。
在本篇总结中,只简单描述用replace()结合正则表达式的方法:
replace():
stringObject.replace(regexp/substr,replacement)
参数 | 描述 |
regexp/substr |
必需。规定子字符串或要替换的模式的 RegExp 对象。 请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象。 |
replacement | 必需。一个字符串值。规定了替换文本或生成替换文本的函数。 |
可以得到下面去除str中的空格和非数字字母的字符后,判断是否为回文串的函数:
function palindrome(str) { // 先后去除空格和非数字字母的字符 var newStr = str.replace(/\s/g,"").replace(/[^a-zA-Z0-9]/g,"").toLowerCase(); //判断翻转后的字符串是否与原字符串相等 var reverStr = newStr.split("").reverse().join(""); if(reverStr === newStr){ return true; } else{ return false; } } palindrome(":_ e y_ e");
最后划一下重点:
/\s/g: 匹配所有空白字符
/[^a-zA-Z0-9]/g: 匹配所有非数字非字母的字符
:)