区分中英文字符的两种方法: 正则和charCodeAt()方法

最近在为项目写登录注册系列页面, 表单验证无疑是不可缺少的部分, 在这个jQ插件满天飞的web年代, 表单验证倒也不是难事. 但再好的插件, 也并不能做到十全十美, 比如这次用到的我先前介绍过的Vanadium表单验证插件, 因为是E文中不存在占2个字符的字, 所以, 区分中英文字符就得自己扩展. 本文就将介绍两种区分中英文字符的方法: 利用正则和charCodeAt方法区分中英文字符.点此查看DEMO
正则无疑是最强大的判断各种条件的方法, 最近也在研习它, 虽然枯燥, 但仍有乐趣. 用它来判断一个双字节的中文字符也是轻而易举地. 而判断中文字符, Mr.Think也是非常推荐用这种方法的, 简单且执行效率高.
核心代码如下:

regExpForm.onblur=function(){
   entryVal=this.value;
   entryLen=entryVal.length;
   cnChar=entryVal.match(/[^\x00-\x80]/g);//利用match方法检索出中文字符并返回一个存放中文的数组
   entryLen+=cnChar.length;//算出实际的字符长度
   }

第二种方法是通过charCodeAt()方法判断Unicode码值, 若大于255即为中文字符(为什么? 请Google ). Mr.Think并不建议用这种方法的, 它的执行效率没有正则高, 也没有正则简单.
核心代码如下:

entryVal=this.value;
   entryLen=entryVal.length;
   for(var i=0;i<entryVal.length;i++){
   if(entryVal.charCodeAt(i)>255){//遍历判断字符串中每个字符的Unicode码,大于255则为中文
   cnArr.push(entryVal[i]);//讲符合条件的值插入到中文字符数组中
   //注意一个小bug,push是向数组的末尾添加一个或多个元素并返回新的长度,所以未刷新的情况下反复blur会累加字符值
   }
   }
   entryLen+=cnArr.length;

原文发布于Mr.Think的博客: http://mrthink.net/js-cn-en-character/ ,转载请注明出处.

posted @ 2010-10-26 16:53 Mr.Think 阅读(1401) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· 展开说说关于C#中ORM框架的用法！
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？

公告

昵称： Mr.Think
园龄： 14年8个月
粉丝： 100
关注： 0

+加关注

2010年10月

日

一

二

三

四

五

六

区分中英文字符的两种方法: 正则和charCodeAt()方法

公告

搜索

常用链接

我的标签

积分与排名

随笔分类 (60)

随笔档案 (53)

Links

阅读排行榜

评论排行榜

推荐排行榜

最新评论