[JS]笔记11之正则表达式
-->什么是正则表达式
-->定义正则
-->正则的索引
-->元字符
-->方括号、量词、其他符号
-->RegExp 对象的方法
-->String 对象方法
1、定义:
正则用于规定在文本中检索的内容,它是对字符串执行模式匹配的强大工具
RegExp(正则表达式) 对象的语法:
new RegExp(pattern, attributes);
pattern为一个字符串或匹配规则
attributes为可选字符串,包含属性g、i 和 m
g:代表全局匹配 (继续往下匹配)
i:代表不区分大小写匹配
m:代表多行匹配,只对^和$模式有用
2、定义正则表达式
定义正则表达式有两种形式:
构造函数方式: new RegExp(pattern, attributes);
例:var reg=new RegExp(“abc","g");
构造函数中的正则可以是常量字符串或一个js变量
普通方式:/pattern/attributes(/正则/属性)
例:var reg=/abc/g;
普通方式中的正则必须是一个常量字符串
3、正则的索引
每个正则表达式都有一个 lastIndex 属性,用于记录上一次匹配结束的位置(索引值)。
获取 reg.lastIndex
设置 reg.lastIndex=0;
4、元字符
\d : 匹配任意一个数字,0~9 中的任意一个
\s : 匹配任意一个空白字符
\b : 匹配一个单词边界,不匹配任何字符
\w : 匹配任意一个字符( 字母、 数字、下划线 )
. : 匹配任意一个字符,除了换行符( \n )
\n : 查找换行符
\u : 通常用来匹配汉字
表达式 "\d","\s","\b","\w",对应的大写字母表示相反的意义
如:\D 匹配所有的非数字字符
5、方括号
[abc] : 查找方括号之间的任何字符。
[^abc] : 查找任何不在方括号之间的字符。
[0-9] : 查找任何从 0 至 9 的数字。
[a-z] : 查找任何从小写 a 到小写 z 的字符。
[A-Z] : 查找任何从大写 A 到大写 Z的字符。
6、量词
n+ : 匹配任何包含至少一个 n 的字符串。
n? : 匹配任何包含零个或一个 n 的字符串。
n* : 匹配任何包含零个或多个 n 的字符串。
n{X} : 匹配包含 X 个 n 的序列的字符串。
n{X,Y} : 匹配包含 X 到Y 个 n 的序列的字符串。
^n : 匹配任何开头为 n 的字符串。
n$ : 匹配任何结尾为 n 的字符串。
7、其他
| : 匹配左边或者右边
\ : 转义符
特殊标点符号,在前面加 \ 后,就代表该符号本身
^ 要匹配 "^" 字符本身,请使用 \^
( ) 要匹配小括号本身,请使用 \( 和 \)
其他特殊标点符号 [ ] { } . ? + * |
Unicode编码16进制的utf-8汉字编码:
4e00最小中文字符 9fa5最大中文字符
/^[\u4e00-\u9fa5]+$/ //常用汉字编码范围
8、RegExp 对象的方法
test:检索字符串中指定的值 返回 true 或 false
reg.test(str);
exec: 检索字符串返回查找结果的第一个值
reg.exec(str);
compile: 该方法可以重编辑指定的正则表达式
var reg=new RegExp("13[4-9](\\d){8}","g");
//重新编辑正则表达式
reg.compile("13[0-3](\\d){8}","g");
9、String 对象方法
search:检索与正则表达式相匹配的值
用法:str.search(reg); (返回索引值,无-1)
match:返回所有正则表达式的匹配(加g)
用法:str.match(reg); (返回数组)
replace:替换与正则表达式匹配的子串
用法:str.replace(reg,"");
split:将字符串匹配的部分做分割(去除)
用法:str.split(reg); (返回数组)
10、代码
关于知识点练习:
1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="UTF-8"> 5 <title>reg1</title> 6 </head> 7 <body> 8 <script> 9 var str1='1abc12Abc34abc56aBc78'; 10 /*定义正则表达式*/ 11 //构造函数方式 12 var reg1=new RegExp('abc','gi'); 13 //普通方式 14 var reg2=/^abc/g//^abc 15 16 /*正则的索引*/ 17 var str='abcdeabfg'; 18 var reg=new RegExp('ab','g'); 19 console.log(reg.test(str));//true 20 //获取索引 21 console.log(reg.lastIndex);//2-上一次匹配结束的位置 22 23 /*regexp对象de方法*/ 24 //test:检索字符串中指定值,返回true或false 25 console.log(reg1.test(str1));//true 26 //设置正则的索引 27 reg1.lastIndex=11;//下次从11开始匹配 28 //exec: 检索字符串返回查找结果的第一个值 29 console.log(reg1.exec(str1));//["abc", index: 0, input: "abc12Abc34abc56aBc78"] 30 31 /*string对象de方法*/ 32 //match:返回所有正则表达式的匹配(加g) 33 console.log(str1.match(reg1));//["abc", "Abc", "abc", "aBc"] 34 //search:检索与正则表达式相匹配的值 35 console.log(str1.search(reg1));//0-字符串第0个就与reg匹配 36 /*js的换行符:\n*/ 37 console.log('abc\n123'); 38 //replace:替换与正则表达式匹配的子串 39 var str3=str1.replace(reg1,'***'); 40 document.write(str3); 41 42 var str2='abc12Abc34\nabc56aBc78'; 43 var reg2=new RegExp('^abc','g');//^abc 44 console.log(str2.match(reg2));//['abc'] 45 var reg3=new RegExp('^abc','gm');//mm:代表多行匹配,只对^和$模式有用 46 console.log(str2.match(reg3));//['abc','abc'] 47 </script> 48 </body> 49 </html>
练习2-和谐敏感字
1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="UTF-8"> 5 <title>敏感字</title> 6 <style> 7 #con{ 8 font-size: 20px; 9 color:red; 10 width:500px; 11 background: #ccc; 12 } 13 #txt{ 14 font-size: 20px; 15 color:blue; 16 width:500px; 17 } 18 </style> 19 </head> 20 <body> 21 <textarea id="txt" cols="50" rows="10"> 22 </textarea> 23 <button id="btn">发布</button> 24 <div id="con"></div> 25 <script> 26 var txt=document.getElementById('txt'); 27 var btn=document.getElementById('btn'); 28 var con=document.getElementById('con'); 29 var reg=/中国政府 |菲律宾|南海|泰国|中国人民解放军/g; 30 btn.onclick=function(){ 31 var connet=txt.value.replace(reg,function(x){ 32 // alert(x);//每次匹配到的词 33 var a=''; 34 for (var i = 0; i < x.length; i++) { 35 a+='*'; 36 } 37 return a; 38 }); 39 con.innerHTML=connet; 40 } 41 </script> 42 </body> 43 </html> 44 <!-- con可写入文字: --> 45 <!-- 中国政府 可以把在仁爱礁的菲律宾军舰拖走,把菲律宾赶出仁爱礁。中国政府 可以在南海诸岛继续建设填海建岛。因为南海各国在经济上是比不了中国的,他们填1米海,中国政府能填100米,最后,仍然是中国占便宜。中国在南海加大巡逻力度,使中国人民解放军在南海占领常态化。每年都在南海举行以救援中国人民解放军救助、人道主义援助为目的军事演习,甚至可以邀请东盟各国(例如泰国、柬埔寨)参加,震慑周边诸国。通过政治、外交、文化交流、经济援助、赠送军舰等手段拉拢分裂东盟国家。(例如柬埔寨、泰国这样与中国政府 南海无利益纠纷的国家)继续加强海军建设,例如建造两栖攻击舰、船坞,中国人民解放军 -->
积累--正则集:
JS正则表达式验证数字 js正则表达式 <script type="text/javascript"> function validate(){ var reg = new RegExp("^[0-9]*$"); var obj = document.getElementById("name"); if(!reg.test(obj.value)){ alert("请输入数字!"); } if(!/^[0-9]*$/.test(obj.value)){ alert("请输入数字!"); } } </script> 验证数字的正则表达式集 验证数字:^[0-9]*$ 验证n位的数字:^\d{n}$ 验证至少n位数字:^\d{n,}$ 验证m-n位的数字:^\d{m,n}$ 验证零和非零开头的数字:^(0|[1-9][0-9]*)$ 验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$ 验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$ 验证非零的正整数:^\+?[1-9][0-9]*$ 验证非零的负整数:^\-[1-9][0-9]*$ 验证非负整数(正整数 + 0) ^\d+$ 验证非正整数(负整数 + 0) ^((-\d+)|(0+))$ 验证长度为3的字符:^.{3}$ 验证由26个英文字母组成的字符串:^[A-Za-z]+$ 验证由26个大写英文字母组成的字符串:^[A-Z]+$ 验证由26个小写英文字母组成的字符串:^[a-z]+$ 验证由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$ 验证由数字、26个英文字母或者下划线组成的字符串:^\w+$ 验证用户密码:^[a-zA-Z]\w{5,17}$ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。 验证是否含有 ^%&',;=?$\" 等字符:[^%&',;=?$\x22]+ 验证汉字:^[\u4e00-\u9fa5],{0,}$ 验证Email地址:^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ 验证InternetURL:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$ 验证电话号码:^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$:--正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。 验证身份证号(15位或18位数字):^\d{15}|\d{}18$ 验证一年的12个月:^(0?[1-9]|1[0-2])$ 正确格式为:“01”-“09”和“1”“12” 验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。 整数:^-?\d+$ 非负浮点数(正浮点数 + 0):^\d+(\.\d+)?$ 正浮点数 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ 非正浮点数(负浮点数 + 0) ^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 负浮点数 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ 浮点数 ^(-?\d+)(\.\d+)?$