JQuery中trim函数的具体实现代码

由于Javascript 1.8.1 之前的版本,没有内置 trim 函数,所以 JQuery 对它有自己的实现。不同的JQuery版本,trim函数的实现也不尽相同。

阅读本文需要掌握正则表达式用法,如果不是很了解,建议阅读这个。如果只是想了解一下,建议读我写的 5分钟读懂正则表达式

鉴于正则表达式的强大用途(在各种语言如JS,Python,Ruby,Java中都会用到),建议重点学习并掌握。

 

JQuery 1.7.2版本


 

// 截取的部分源码,不是完整语句,旨在说明实现过程
trimLeft = /^\s+/,
trimRight = /\s+$/,

text.toString().replace( trimLeft, "" ).replace( trimRight, "" );

简化后就是

yourstr.replace( /^\s+/, "" ).replace(/\s+$/, "" )
// 正则表达式 /^\s/     匹配以空白字符串开头的字符串
// 正则表达式 /\s+$/   匹配以空白字符串结尾的字符串
//replace参数,左边是查找模式,右边是替换量,返回替换后的字符串

 

JQuery 2.1.1 版本


 

var whitespace = "[\\x20\\t\\r\\n\\f]",
    rtrim = new RegExp( "^" + whitespace + "+|((?:^|[^\\\\])(?:\\\\.)*)" + whitespace + "+$", "g" );
//....
trim: function( text ) {
    return text == null ?
        "" :
        ( text + "" ).replace( rtrim, "" );
},

合并之后,从字符串转变为正则表达式(各去掉一个反斜线!)

字符串  "^[\\x20\\t\\r\\n\\f]+|((?:^|[^\\\\])(?:\\\\.)*)[\\x20\\t\\r\\n\\f]+$"
正则表达式   /^[\x20\t\r\n\f]+|((?:^|[^\\])(?:\\.)*)[\x20\t\r\n\f]+$/g
//其实,若不考虑转义,空白符用...替代
//可这么理解(注意:这么写只是帮助理解,不是内部原理)
/ ^ [...]+ | ( (?: ^ | [^\] ) (?:.)* ) [...]+ $/g
//(?:) 可同义替换为 ()
/ ^ [...]+ | ( ( ^ | [^\] )) (.)* )    [...]+ $/g

 

细看会发现其实它是有两个部分组合的。一是:whitespace,一是 ((?:^|[^\\\\])(?:\\\\.)*)。其中whitespace就是空格符,制表符,回车符,换行符,翻页符。

下面细细说说后面这串表达式含义。

 

由简入繁:

/^[...]+ | ( (?: ) ( )* ) [...]+ $/g
/^[...]+ | ( (?: ^ | [^\\] ) (?:\\.)* ) [...]+ $/g
//(?:)             可同义替换为 ()    
//[^\\]            除了\的任一字符
//(^|[^\\])        开头没有字符 或 非\的字符
//(?:\\.)*         任一字符(不含\n换行符)重复0或多次
// | 后面意思就是    开头没有字符(即下个字符即为原始串的第一个字符)或是非\字符(此时才1位字符)
//                 和除了换行符的任意字符串
//                 和一个whitespace,然后字符串结束
//
//当然 | 前面无非就是匹配以 whitespace 开头而已

 

 

其实,实现 trim 函数不止有以上几种办法,而且 JQuery 采用的也不是最好的。这里是一些其它的实现:

 

实现1

String.prototype.trim=function(){returnthis.replace(/^\s\s*/,'').replace(/\s\s*$/,'');}

看起来不怎么样,动用了两次正则替换,实际速度非常惊人,主要得益于浏览器的内部优化。一个著名的例子字符串拼接,直接相加比用Array做成的StringBuffer还快。base2类库使用这种实现.

 

实现2

String.prototype.trim=function(){returnthis.replace(/^\s+/,'').replace(/\s+$/,'');}

和实现1很相似,但稍慢一点,主要原因是它最先是假设至少存在一个空白符。Prototype.js使用这种实现,不过其名字为strip,因为Prototype的方法都是力求与Ruby同名。可以看到Jquery1.7版本也是用的这个方法。

 

实现3

String.prototype.trim=function(){returnthis.substring(Math.max(this.search(/\S/),0),this.search(/\S\s*$/)+1);}

以截取方式取得空白部分(当然允许中间存在空白符),总共调用了四个原生方法。设计得非常巧妙,substring以两个数字作为参数。Math.max以两个数字作参数,search则返回一个数字。速度比上面两个慢一点,但比下面大多数都快。

 

实现4

String.prototype.trim=function(){returnthis.replace(/^\s+|\s+$/g,'');}

这个可以称得上实现2的简化版,就是利用候选操作符连接两个正则。但这样做就失去了浏览器优化的机会,比不上实现3。由于看来很优雅,许多类库都使用它,如JQuery与mootools

 

实现5

String.prototype.trim=function(){var str =this; str = str.match(/\S+(?:\s+\S+)*/);return str ? str[0]:'';}

match是返回一个数组,因此原字符串符合要求的部分就成为它的元素。为了防止字符串中间的空白符被排除,我们需要动用到非捕获性分组(?:exp)。由于数组可能为空,我们在后面还要做进一步的判定。好像浏览器在处理分组上比较无力,一个字慢。所以不要迷信正则,虽然它基本上是万能的。

 

实现6

String.prototype.trim=function(){returnthis.replace(/^\s*(\S*(\s+\S+)*)\s*$/,'$1');}

把符合要求的部分提供出来,放到一个空字符串中。不过效率很差,尤其是在IE6中。

 

实现7

String.prototype.trim=function(){returnthis.replace(/^\s*(\S*(?:\s+\S+)*)\s*$/,'$1');}

和实现6很相似,但用了非捕获分组进行了优点,性能效之有一点点提升。

 

实现8

String.prototype.trim=function(){returnthis.replace(/^\s*((?:[\S\s]*\S)?)\s*$/,'$1');}

沿着上面两个的思路进行改进,动用了非捕获分组与字符集合,用?顶替了*,效果非常惊人。尤其在IE6中,可以用疯狂来形容这次性能的提升,直接秒杀火狐。

 

实现9

String.prototype.trim=function(){returnthis.replace(/^\s*([\S\s]*?)\s*$/,'$1');}

这次是用懒惰匹配顶替非捕获分组,在火狐中得到改善,IE没有上次那么疯狂。

 

实现10

String.prototype.trim=function()
{
var str =this, whitespace =' \n\r\t\f\x0b\xa0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000';

for(var i =0,len = str.length; i < len; i++){   if(whitespace.indexOf(str.charAt(i))===-1){     str = str.substring(i);break;
  }
}

for(i = str.length-1; i >=0; i--){   if(whitespace.indexOf(str.charAt(i))===-1){     str = str.substring(0, i +1);break;   } } return whitespace.indexOf(str.charAt(0))===-1? str :''; }

我只想说,搞出这个的人已经不是用牛来形容,已是神一样的级别。它先是把可能的空白符全部列出来,在第一次遍历中砍掉前面的空白,第二次砍掉后面的空白。全过程只用了indexOf与substring这个专门为处理字符串而生的原生方法,没有使用到正则。速度快得惊人,估计直逼上内部的二进制实现,并且在IE与火狐(其他浏览器当然也毫无疑问)都有良好的表现。速度都是零毫秒级别的。

 

实现11

String.prototype.trim=function(){
var str =this, str = str.replace(/^\s+/,'');
for(var i = str.length-1; i >=0; i--){
    if(/\S/.test(str.charAt(i))){
      str =str.substring(0, i +1);
    break;
  }
}

return str;
}

实现10已经告诉我们普通的原生字符串截取方法是远胜于正则替换,虽然是复杂一点。但只要正则不过于复杂,我们就可以利用浏览器对正则的优化,改善程序执行效率,如实现8在IE的表现。我想通常不会有人在项目中应用实现10,因为那个whitespace 实现太长太难记了(当然如果你在打造一个类库,它绝对是首先)。实现11可谓其改进版,前面部分的空白由正则替换负责砍掉,后面用原生方法处理,效果不逊于原版,但速度都是非常逆天。

 

实现12

String.prototype.trim=function(){
var str =this, str = str.replace(/^\s\s*/,''), ws =/\s/, i = str.length;
while (ws.test(str.charAt(--i)));

return str.slice(0, i +1);
}

实现10与实现11在写法上更好的改进版,注意说的不是性能速度,而是易记与使用上。和它的两个前辈都是零毫秒级别的,以后就用这个来工作与吓人。

下面是老外给出的比较结果,执行背景是对Magna Carta 这文章(超过27,600字符)进行trim操作。

 

内容参考:Javascript trim函数大赏

 

 

posted @ 2014-05-26 15:32  HolyGrail  阅读(1978)  评论(0编辑  收藏  举报
设计良好的程序将用户的注意力视为有限的宝贵资源,只有在必要时才要求使用。 ——《Unix编程艺术》