[导入]汉字正则

识别utf-8编码字符的正则表达式应为   "/[\xf0-\xf7][\x80-\xbf]{3}|[\xe0-\xef][\x80-\xbf]{2}|[\xc2-\xdf][\x80-\xbf]|[\x01-\x7f]/。

据传是因为utf8的汉字编码有1-4个字节组成

bestmost 2009-02-27 14:47 发表评论

文章来源:http://www.phpweblog.net/fuyongjie/archive/2009/02/27/6355.html
posted @ 2009-03-06 01:12  宇风  阅读(127)  评论(0编辑  收藏  举报