汉字正则

识别utf-8编码字符的正则表达式应为 "/["xf0-"xf7]["x80-"xbf]{3}|["xe0-"xef]["x80-"xbf]{2}|["xc2-"xdf]["x80-"xbf]|["x01-"x7f]/。

据传是因为utf8的汉字编码有1-4个字节组成
posted @ 2009-04-27 09:53  Just for Fun  阅读(441)  评论(0编辑  收藏  举报