jQuery源码学习笔记八
今天把jQuery的Sizzle选择器引擎讲完。最后给出其大体的工作流程。这东西非常复杂,不要妄图看一遍就明白了。无论看懂与否,多看点源码,还是有裨益的。至少在处理循环结构上有收获吧。
//@author 司徒正美|なさみ|cheng http://www.cnblogs.com/rubylouvre/ All rights reserved // EXPOSE jQuery.find = Sizzle; jQuery.filter = Sizzle.filter; jQuery.expr = Sizzle.selectors; //以:开头许多都是自定义伪类 jQuery.expr[":"] = jQuery.expr.filters; //css属性display引起的元素不可见 Sizzle.selectors.filters.hidden = function(elem){ return elem.offsetWidth === 0 || elem.offsetHeight === 0; }; //css属性display引起的元素不可见 Sizzle.selectors.filters.visible = function(elem){ return elem.offsetWidth > 0 || elem.offsetHeight > 0; }; //是否在运动中 Sizzle.selectors.filters.animated = function(elem){ return jQuery.grep(jQuery.timers, function(fn){ return elem === fn.elem; }).length; }; //重载jQuery.multiFilter jQuery.multiFilter = function( expr, elems, not ) { if ( not ) { expr = ":not(" + expr + ")"; } return Sizzle.matches(expr, elems); }; //把路径上的元素放到结果上,dir为parentNode,previousSibling,nextSilbing jQuery.dir = function( elem, dir ){ var matched = [], cur = elem[dir]; while ( cur && cur != document ) { if ( cur.nodeType == 1 ) matched.push( cur ); cur = cur[dir]; } return matched; }; //在内部调用result好像都为2,dir为previousSibling,nextSilbing //用于子元素过滤 jQuery.nth = function(cur, result, dir, elem){ result = result || 1; var num = 0; //如果cur为undefined中止循环 for ( ; cur; cur = cur[dir] ) if ( cur.nodeType == 1 && ++num == result ) break; return cur; }; //查找不等于elem的兄弟元素节点 jQuery.sibling = function(n, elem){ var r = []; for ( ; n; n = n.nextSibling ) { if ( n.nodeType == 1 && n != elem ) r.push( n ); } return r; }; return; window.Sizzle = Sizzle;
好了,回头看Sizzle的主程序部分:
Sizzle.find = function(expr, context, isXML){ var set, match; if ( !expr ) {//如果不是字符串表达式则返回空数组 return []; } for ( var i = 0, l = Expr.order.length; i < l; i++ ) { var type = Expr.order[i], match;//按照ID NAME TAG的优先级顺序执行 //这里可以想象一下 //match = "#aaa".exec( /#((?:[\w\u00c0-\uFFFF_-]|\\.)+)/) //然后检测match是否为空数组,空数组相当于false if ( (match = Expr.match[ type ].exec( expr )) ) { //ID的正则 /#((?:[\w\u00c0-\uFFFF_-]|\\.)+)/ var left = RegExp.leftContext //如果不是一步到位,是复杂的表达式,需要多次查找与筛选 if ( left.substr( left.length - 1 ) !== "\\" ) { //把换行符去掉,得到正常的字段 //如"#id12\ //34" //去掉后,就得到"#id1234" match[1] = (match[1] || "").replace(/\\/g, ""); set = Expr.find[ type ]( match, context, isXML ); if ( set != null ) { //移除相应部分的表达, // 如#aaa ee,得到ID对应的元素后,把#aaa去掉, //然后用Expr的表达式来匹配剩下的部分 expr = expr.replace( Expr.match[ type ], "" ); break; } } } } if ( !set ) { //返回所有后代 set = context.getElementsByTagName("*"); } return {//返回一个对象 set: set, expr: expr }; };
Sizzle.filter = function(expr, set, inplace, not){ var old = expr, result = [], curLoop = set, match, anyFound, isXMLFilter = set && set[0] && isXML(set[0]); while ( expr && set.length ) { for ( var type in Expr.filter ) { //这是Expr.filter中的键值对 //PSEUDO: function(elem, match, i, array){}, //CHILD: function(elem, match){}, //ID: function(elem, match){}, //TAG: function(elem, match){}, //CLASS: function(elem, match){}, //ATTR: function(elem, match){}, //POS: function(elem, match, i, array){} if ( (match = Expr.match[ type ].exec( expr )) != null ) {//match为数组 var filter = Expr.filter[ type ], found, item;//filter这函数 anyFound = false; if ( curLoop == result ) {//如果结果集为空数组,就让result = []; result = []; } if ( Expr.preFilter[ type ] ) { //这是Expr.preFilter中的键值对 //CLASS: function(match, curLoop, inplace, result, not, isXML){}, //ID: function(match){}, //TAG: function(match, curLoop){}, //CHILD: function(match){ }, //ATTR: function(match, curLoop, inplace, result, not, isXML){}, //PSEUDO: function(match, curLoop, inplace, result, not){ }, //POS: function(match){} //preFilter与filter的功能不同,preFilter对字符串进行调整,好让选择器能找到元素 //filter对查找到的元素或元素数组进行筛选 match = Expr.preFilter[ type ]( match, curLoop, inplace, result, not, isXMLFilter ); if ( !match ) {//如果返回的是false anyFound = found = true;//就把anyFound与found标记为true } else if ( match === true ) { continue; } } if ( match ) { for ( var i = 0; (item = curLoop[i]) != null; i++ ) { if ( item ) { //检测元素是否符合要求 found = filter( item, match, i, curLoop ); var pass = not ^ !!found; if ( inplace && found != null ) { if ( pass ) { anyFound = true; } else { curLoop[i] = false; } } else if ( pass ) { result.push( item );//符合要求就放到结果数组中 anyFound = true; } } } } if ( found !== undefined ) { if ( !inplace ) { curLoop = result;//结果数组将作为一下次要遍历的元素集合返回 } //移除用户输入字符串已查找了的那一部分表达式 expr = expr.replace( Expr.match[ type ], "" ); if ( !anyFound ) { return []; } break; } } } // Improper expression if ( expr == old ) { if ( anyFound == null ) { throw "Syntax error, unrecognized expression: " + expr; } else { break; } } old = expr; } return curLoop; };
主程序:
var Sizzle = function(selector, context, results, seed) { results = results || []; context = context || document; if ( context.nodeType !== 1 && context.nodeType !== 9 ) return [];//context必须为DOM元素或document,要不返回空数组 if ( !selector || typeof selector !== "string" ) { return results;//selector必须存在并且为字符串,否则返回上次循环的结果集 } var parts = [], m, set, checkSet, check, mode, extra, prune = true; // Reset the position of the chunker regexp (start from head) chunker.lastIndex = 0; while ( (m = chunker.exec(selector)) !== null ) { parts.push( m[1] ); if ( m[2] ) { extra = RegExp.rightContext;//匹配内容的右边归入extra break; } } //POS: /:(nth|eq|gt|lt|first|last|even|odd)(?:\((\d*)\))?(?=[^-]|$)/, if ( parts.length > 1 && origPOS.exec( selector ) ) { //处理E F E > F E + F E ~ F if ( parts.length === 2 && Expr.relative[ parts[0] ] ) { //这里的parts[0]肯定不是“”,亦即不会是后代选择器 set = posProcess( parts[0] + parts[1], context ); } else { set = Expr.relative[ parts[0] ] ? [ context ] : Sizzle( parts.shift(), context ); while ( parts.length ) { selector = parts.shift() if ( Expr.relative[ selector ] ) selector += parts.shift(); set = posProcess( selector, set ); } } } else { var ret = seed ? { expr: parts.pop(), set: makeArray(seed) } : Sizzle.find( parts.pop(), parts.length === 1 && context.parentNode ? context.parentNode : context, isXML(context) ); set = Sizzle.filter( ret.expr, ret.set ); if ( parts.length > 0 ) { checkSet = makeArray(set); } else { prune = false; } while ( parts.length ) {//倒序的while循环比for循环快 var cur = parts.pop(), pop = cur; if ( !Expr.relative[ cur ] ) { cur = ""; } else { pop = parts.pop(); } if ( pop == null ) { pop = context; } Expr.relative[ cur ]( checkSet, pop, isXML(context) ); } } if ( !checkSet ) { checkSet = set; } if ( !checkSet ) { throw "Syntax error, unrecognized expression: " + (cur || selector); } //数组化NodeList,并加入结果集中 if ( toString.call(checkSet) === "[object Array]" ) { if ( !prune ) { results.push.apply( results, checkSet ); } else if ( context.nodeType === 1 ) { for ( var i = 0; checkSet[i] != null; i++ ) { if ( checkSet[i] && (checkSet[i] === true || checkSet[i].nodeType === 1 && contains(context, checkSet[i])) ) { results.push( set[i] ); } } } else { for ( var i = 0; checkSet[i] != null; i++ ) { if ( checkSet[i] && checkSet[i].nodeType === 1 ) {//确保是元素节点 results.push( set[i] ); } } } } else { makeArray( checkSet, results ); } if ( extra ) { Sizzle( extra, context, results, seed ); if ( sortOrder ) { hasDuplicate = false; results.sort(sortOrder);//重排结果集中的DOM元素,按照原来在网页先后顺序排列 if ( hasDuplicate ) { for ( var i = 1; i < results.length; i++ ) {//确保没有重复的DOM元素,方法比较垃圾 if ( results[i] === results[i-1] ) { results.splice(i--, 1); } } } } } return results; };
最后重新说一下其逻辑:
- 首先用一个叫chunker的强大正则,把诸如 var str = " #div , h1#id\
dd.class > span[dd='22222 > 3233'] ul+ li, .class:contain(\"你的+ 999\"),strong span ";这样的字符串,Sizzle称之为selector的东西,分解成一个数组。 - 接着对上下文的内容进行判断,确保其为DOM元素或document,否则返回空数组。然后判断selector是否为字符串,由于Sizzle会不断递归调用,selector会越来越短的,直到为零。这些越来越短的selector其实也是第一次chunker 分解的结果之一。不过它们都有可能g再遭分解。每一次循环,这些分解了的字符串都会经过筛选(非空字符),放入parts数组中。
- 这些selector最先会判断一下,是否为亲子兄长相邻后代等关系选择器。由于第一次chunker把大部分空白消灭了,造成了一个不幸的结果,把后代选择器也消灭了。因此必须补上后代选择器。详见后面posProcess的“selector + "*"”操作。
- 在选择器中,也亦即id,tag,name具有查找能力,在标准浏览器中重载了class部分,让getElementsByClassName也能工作。如果querySelectorAll能工作最好不过,整个Sizzle被重载了。总而言之,Sizzle.find所做的工作比较少,它是按[ "ID", "NAME", "TAG" ]的优先级查找元素的。不过在这之前,先要调用Expr.preFilter把连字符"\"造成的字符串破坏进行修复了。如上面的例子,h1#iddd由于中间的连字符串被切成两个部分,成了数组中的两个元素h1#dd与dd。显然这样查找会找不到dd这个ID,后面查找所有dd元素也是错误的,因此必须把它们重新整合成一个元素h1#dddd。
- 根据id,name与tag找到这些元素后,下一个循环就是找它们的子元素或后代元素了,所以Sizzle才会急冲冲地修复后代选择器的问题。至于筛选,Expr有大量的方法来进行。最后是重新排序与去除重复选中的元素,以结果集返回。
机器瞎学/数据掩埋/模式混淆/人工智障/深度遗忘/神经掉线/计算机幻觉/专注单身二十五年