php 正则反斜杠的解析特性

前言:PHP正则反斜杠的解析特性

参考文章:https://www.t00ls.net/articles-55906.html

先看一段代码,看起来很正常,但是实际上这段代码会报错,如下所示

<?php 
$mat = "123456";
var_dump(preg_match("#\\\\|\\#i", "123",$mat));

它会报错,报错的信息是 结束分隔符不存在,这里指的结束分隔符实际上在PHP正则中就是定界符

再看这段,只是前后换了下位置 发现就不会报错了!

if(preg_match("#\\|\\\\#i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

那么问题肯定出现在\\上,我们对 $cmd 进行传数据来匹配

$cmd => \ 单个反斜杠 结果 无匹配

$cmd => \\ 两个反斜杠 结果 无匹配

发现结果都不匹配!

那么来看看 \\ 的问题所在,其实这里正则中的\\ 的解析流程是这样的:

1、 \\ 先经过PHP正则解析器为一个\

2、\ 又跟'|'结合到一起,从而在 正则表达式的解析器解析为\|

3、又因为'|'是正则中的保留符号,所以需要一个转义符来转义,所以\\|这个的结果就是匹配 '|'

4、后面又跟了\\\\,这里 先经过PHP正则解析器为 \\,然后在经过 正则表达式的解析器为 ''

5、那么最后的正则表达式就是匹配|\ 这两个符号!

那么也就可以理解上面的那个为什么会报错了,因为结果就是匹配\#,所以我们还需要加个 定界符#,来进行修复,如下所示

<?php 

$mat = "123456";
var_dump(preg_match("#\\\\|\\##i", "123",$mat));

然后看了下面的评论酒馆师傅说代码审计中存在,以后在代码中也需要多多关注!

posted @ 2020-04-12 19:35  zpchcbd  阅读(916)  评论(0编辑  收藏  举报