PHP正则匹配中文汉字注意

preg_match('/^[a-zA-Z\x{4e00}-\x{9fa5}]+$/u', $str)

如上,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!

 

u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
utf8格式的匹配模式字符串必须要使用  u 修饰符。 否则出现程序意料之外的异常情况。
代码 :
preg_match('/[<>\\\′""&#=\+]/', '张利', $match);
var_dump($match);
结果 :array(1) {
  [0]=>
  string(1) "�"
}
preg_match('/[<>\\\′""&#=\+]/u', '张利', $match);
var_dump($match);
结果 :array(0) {
}

 

posted @ 2018-09-10 09:25  一粒小米-博客  阅读(6260)  评论(0编辑  收藏  举报