JavaScript 正则表达式

 什么是正则?
    正则表达式(regular expression)是一个描述字符规则的对象。可以用来检查一个字符串是否含有某个字符,将匹配的字符做替换或者从某个字符串中取出某个条件的子串等。
    
 正则表达式:
 正则表达式其实就是一种规则,其实把正则称作规则表达式更为恰当。正则的语法基于一种古老的perl语言。
 
为什么要用正则:
    前端往往有大量的表单数据校验工作,采用正则表达式会使得数据校验的工作量大大减轻。常用效果:邮箱,手机号,身份证号等(使用熟练的情况下)
 
 正则的使用理念:
 任何程序都可以不用正则表达式写出来,但根据懒人原则,怎么做不言而喻。
 
创建方式
正则的创建方式:
    1.构造函数方式
        var reg1 = new RegExp("a");
        var str = "adassdfsd";
        console.log(str.match(reg1))        //输出匹配a的字符
ex:

// var reg2 = new RegExp("a");

// console.log(reg)
// console.log(reg2)
// console.log(typeof reg2)
// console.log(typeof reg)
// console.log(reg2 == reg)
// console.log(reg3 == reg)

 
    2.字面量方式,古老的perl语言风格
        var reg2 = /a/;
        console.log(str2.match(reg2));      //输出匹配a的字符
ex:

// var reg = /a/;
// var reg3 = /a/;

 
 
      / / 是正则表达式的标识符
      " " 是字符串的标识符
      [ ] 是数组的标识符
      { } 是对象的标识符
    正则中的修饰符,写在正则表达式后面/的后面:
    g表示全局匹配,查找所有
    i表示忽略大小写
 
    正则的验证:
    var reg = /[0-9]/;
    reg.test(str)    //返回为true表示验证成功,false表示失败
 

 

修饰符

修饰符 可以在全局搜索中不区分大小写:


修饰符描述
i 执行对大小写不敏感的匹配。
g 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
m 执行多行匹配。

正则表达式模式


方括号用于查找某个范围内的字符:


表达式描述
[abc] 查找方括号之间的任何字符。
[0-9] 查找任何从 0 至 9 的数字。
(x|y) 查找任何以 | 分隔的选项。

元字符是拥有特殊含义的字符


元字符描述
\d 查找数字。
\s 查找空白字符。
\b 匹配单词边界。
\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符。

量词:限定符,可以指定正则表达式的一个给定组,必须要出现多少次才能满足匹配


量词描述
n+ 匹配任何包含至少一个 n 的字符串。
n* 匹配任何包含零个或多个 n 的字符串。
n? 匹配任何包含零个或一个 n 的字符串。

 *     匹配前面的子表达式零次或多次

    +     匹配前面的子表达式至少一次或多次

    ?     匹配前面的子表达是零次或一次

    {n}   匹配确定n次

    {n,}  至少匹配n次

    {n,m} 至少匹配n次,最多匹配m次

 
    注:在限定符后紧跟?,则由贪婪匹配变成非贪婪匹配

补充:
  \d    匹配所有的数字
    var reg = /\d/g;
    console.log(str.match(reg))    //打印字符串中所有的数字
 
    +     若干,量词,表示多少个都可以,至少1个,无上限
    var reg = /\d+/g;

    console.log(str.match(reg))    //打印字符串中所有的数字,连续

    |     或,类似于js中的 ||

    var reg = /abc|bbc|cbc|dbc/g

    console.log(str.match(reg));   //打印字符串中的abc,bbc,cbc,dbc

    var reg = /[a-c]bc/g

    [ ]    中元符

    var reg = /[a-z]/              //匹配所有字母

    [0-9] == \d

    ^     排除(除了)

    var reg = /[^0-9]/             //表示除了数字之外所有
 
    .   代表所有,不建议使用

    var reg = /<.+>/g

    console.log(str.replace(reg,""))              //过滤,表示尖括号里面的东西不要,但是?

 
    转义字符:

    \d    ——    [0-9]         数字

    \w    ——    [a-z0-9_]     数字,字母,下划线

    \s    ——    空白字符(空格)  

    \D    ——    [^0-9]        非数字

    \W    ——    [^a-z0-9_]    非数字,字母,下划线

    \S    ——    非空白字符

   正则的贪婪定律:
    var reg = /<[^<>]+>/g
    console.log(str.replace(reg,"”))              //表示尖括号里面的东西不要,真

 

正则的方法
    正则.test(字符串)方法,返回值是true和false
    正则.test(字符串)有一个特性,就是只要字符串的一部分符合要求,那么就会返回true
解决方法:
^开始
$结束

使用 test()

test() 是一个正则表达式方法。

它通过模式来搜索字符串,然后根据结果返回 true 或 false。

下面的例子搜索字符串中的字符 "e":

var patt = /e/;

patt.test("The best things in life are free!"); 

由于字符串中有一个 "e",以上代码的输出将是:true

使用 exec()

exec() 方法是一个正则表达式方法。

它通过指定的模式(pattern)搜索字符串,并返回已找到的文本。

如果未找到匹配,则返回 null。

下面的例子搜索字符串中的字符 "e":

/e/.exec("The best things in life are free!");

由于字符串中有一个 "e",以上代码的输出将是:e


使用字符串方法:
不能直接使用,配合方法使用,正则一般都是用来验证字符的
 字符:
str.match(reg)
 str.replace(reg)


字符串.replace(oldstr, newstr)函数 和 字符串.match(正则)函数
    字符串的replace函数的功能:将老字符串替换成新字符串
 
    可以利用此函数,将老字符串表示成正则表达式,对字符串进行替换
 
    如:字符串中的abc替换成“哈哈”,如果正则后面没有g,则只替换一个,如果没有i,则大写不会替换
    var str = “abc123abc456abbcdABCefaacbcdbcabc";
    var reg = /abc/g;
    console.log(str.replace(reg,"哈哈"));
 
    字符串match函数的功能:提取所有的想要的东西
    返回一个数组,包含所有符合条件的字符
 

常用检测方式:

1.中文检测
    unicode编码中文监测:/^[\u2E80-\u9FFF]+$/
 
2.用户名检测
    正则:/^[a-z0-9_-]{3,16}$/
 
3.邮箱检测
    /^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/
      可以多次出现 (字母数字下划线.-)@可以出现多个(数字字母.-).2到6位字母或.
    /^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/
可以有多个(字母数字)可有多个可无(.多个(字母数字))@可以多个(数字字母可   有1次可无(-数字字母))可以有多个(1或2个.多个字母)
 abc123@123abc.com
 
4.URL检测
    /^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w\.-]*)*\/?$/
有1次或0次(http有1次或0次s : //) 可以多个(数字字母.-) . 2到6位(字母.) 可多个或0个 (可以多个或0个 /数字字母下划线.-) 可0或1次/
 
5.HTML标签检测
    /^<([a-z]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)$/
<多个(字母)可多个或0个(除了<的所有字符)  />
<多个(字母)可多个或0个(除了<的所有字符)>多个任意字符   </重复第一部分的多个字母>
 
6.自定义的html标签
/<[^<>]+>/g
 
 
正则的写(练习):

简单邮箱:字母开头数字6位 @ 数字字母2~9 . 字母2~4
// var str = "a70420@qq.com";
// var reg = /^[a-z][a-z0-9]{0,5}@[a-z0-9]{2,9}\.[a-z]{2,4}$/;
// console.log(reg.test(str))


// qq号
// var str = "704206198";
// var reg = /^[1-9]\d{4,11}$/;
// console.log(reg.test(str))


// 邮编
// var str = "200000";
// var reg = /^\d{6}$/;
// console.log(reg.test(str))


// 固话
// var str = "0562-1234567-1021";
// var str = "0562-1234567";
// var str = "1234567";
// var str = "1234567-1021";
// var reg = /^(0\d{2,3}-)?[1-9]\d{6}(-\d{1,4})?$/;
// console.log(reg.test(str))


// 网址
// var str = "https://www.baidu.com.cn"
// var str = "https://www.baidu.com.cn"
// var str = "http://www.baidu.com"
// var str = "www.baidu.com"
// var str = "mp3.baidu.com"
// var str = "baidu.com"
// var reg = /^(https?:\/\/)?([a-z\d]{1,6}\.)?[a-z\d]{2,18}(\.[a-z]{2,4}){1,2}$/;
// console.log(reg.test(str))

 

 

正则表达式手册 :http://tool.oschina.net/uploads/apidocs/jquery/regexp.html

posted on 2019-09-24 17:12  __"仅此少年ღ  阅读(190)  评论(0编辑  收藏  举报