[导入]汉字正则
识别utf-8编码字符的正则表达式应为 "/[\xf0-\xf7][\x80-\xbf]{3}|[\xe0-\xef][\x80-\xbf]{2}|[\xc2-\xdf][\x80-\xbf]|[\x01-\x7f]/。
据传是因为utf8的汉字编码有1-4个字节组成![](http://www.phpweblog.net/fuyongjie/aggbug/6355.html)
文章来源:http://www.phpweblog.net/fuyongjie/archive/2009/02/27/6355.html
据传是因为utf8的汉字编码有1-4个字节组成
文章来源:http://www.phpweblog.net/fuyongjie/archive/2009/02/27/6355.html