普遍使用的正则是[\u4e00-\u9fa5],但这个范围并不完整。例如: |
/[\u4e00-\u9fa5]/.test( '⻏' ) // 测试部首⻏,返回false |
根据Unicode 5.0版编码,要准确的判断一个中文字符要包括: |
2E80-2EFF CJK 部首补充 2F00-2FDF 康熙字典部首 |
3000-303F CJK 符号和标点 31C0-31EF CJK 笔画 |
3200-32FF 封闭式 CJK 文字和月份 3300-33FF CJK 兼容 |
3400-4DBF CJK 统一表意符号扩展 A 4DC0-4DFF 易经六十四卦符号 |
4E00-9FBF CJK 统一表意符号 F900-FAFF CJK 兼容象形文字 |
FE30-FE4F CJK 兼容形式 FF00-FFEF 全角ASCII、全角标点 |
var rcjk = /[\u2E80-\u2EFF\u2F00-\u2FDF\u3000-\u303F\u31C0-\u31EF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30-\uFE4F\uFF00-\uFFEF]+/g; |
如果不希望匹配标点、符号,在正则中去掉对应的范围即可: |
3000-303F CJK 符号和标点 FF00-FFEF 全角ASCII、全角标点 |
或者charCodeAt()>255
原帖地址:http://my.oschina.net/u/1182602/blog/406435
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
· C# 深度学习:对抗生成网络(GAN)训练头像生成模型
· 手把手教你更优雅的享受 DeepSeek
· AI工具推荐:领先的开源 AI 代码助手——Continue
· 探秘Transformer系列之(2)---总体架构
· V-Control:一个基于 .NET MAUI 的开箱即用的UI组件库
· 乌龟冬眠箱湿度监控系统和AI辅助建议功能的实现