摘要: 转http://bbs.chinaunix.net/thread-907172-1-1.html最近项目中用到了对文字、标点以及特殊字符的判断。网上关于GBK、GB2312和BIG5编码范围的资料比较多,但是日文的资料比较少,我总结了一下,希望能对大家在正则中判断这些字符集尤其是日文字符集的各种字、标点以及特殊符号的时候有所帮助。UTF8CODE:[/x01-/x7f]|[/xc0-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}UTF16CODE:[/x00-/xd7][/xe0-/xff]|[/xd8- 阅读全文
posted @ 2013-05-25 15:50 sunsweet 阅读(425) 评论(0) 推荐(0) 编辑