Fork me on GitHub

sizzle分析记录:分解流程

<form>
  <label>Name:</label>
  <input name="name" />
  <fieldset>
      <label>Newsletter:</label>
      <div name="newsletter" /><p>1<p</div>
      <div name="letter" /><p name='aaron'>2<p></div>
      <div name="tter" /><p>3<p</div>
 </fieldset>
</form>

js

$("form div > p[name=aaron]")

解析的流程:

编译器:分5个步骤

涉及: TAG元素 关系选择器 属性选择器

1:通过tokenize词法分析器分组

image

 


2:遍历tokens,从右边往左边开始筛选,最快定位到目标元素合集

//先看看有没有搜索器find,搜索器就是浏览器一些原生的取DOM接口,简单的表述就是以下对象了
            // Expr.find = {
            // 'ID'    : context.getElementById,
            // 'CLASS' : context.getElementsByClassName,
            // 'TAG'   : context.getElementsByTagName
            //        }

操作如下

Expr.find["TAG"] = support.getElementsByTagName ?
    function( tag, context ) {
        if ( typeof context.getElementsByTagName !== strundefined ) {
            return context.getElementsByTagName( tag );
        }
    } :

那么第一筛选找到的定位元素,就形成了一个 seed种子合集,那么余下的所有的操作都是围绕这个种子合集处理

因为节点总是存在各种关系的,所以不管是通过这个最靠近的目标的元素,往上还是往下 都是可以处理的

 


3:重组选择器,开始执行继续分解"form div > [name=aaron]"

因为种子合已经抽出了,所以选择器就需要重新排列

"form div > [name=aaron]"

踢掉了P元素,已经被抽离了

 


4 : 生成编译处理器

这里为什么要这么复杂,因为生成了编译闭包可以缓存起来,通过这种机制,增加了重复选择器的效率

在matcherFromTokens方法中通过分解tokens生成对应的处理器

例如:form div [name=aaron]

在分解过程中分2大块

A:关系选择器的处理  > + ~ 空

B: ATTR CHILD CLASS ID PSEUDO TAG的处理

用matchers保留组合关系

1:分解第一个TAG:form 保存处理器到matchers.push( Expr.filter[“TAG”]) ;

2:分解第二个“空”的关系选择器,此时

 A:用elementMatcher把之前的matchers压入到这个匹配里面,生成一个遍历方法的处理

function elementMatcher( matchers ) {
    return matchers.length > 1 ?
        function( elem, context, xml ) {
            var i = matchers.length;
            while ( i-- ) {
                if ( !matchers[i]( elem, context, xml ) ) {
                    return false;
                }
            }
            return true;
        } :
        matchers[0];
}

B:用addCombinator再次包装,生成一个位置关系的查找关系

function addCombinator( matcher, combinator, base ) {
    var dir = combinator.dir,
        checkNonElements = base && dir === "parentNode",
        doneName = done++;

    return 
        // Check against all ancestor/preceding elements
        // 检查所有祖先/元素
        function( elem, context, xml ) {
            var oldCache, outerCache,
                newCache = [ dirruns, doneName ];
                while ( (elem = elem[ dir ]) ) {
                    if ( elem.nodeType === 1 || checkNonElements ) {
                        outerCache = elem[ expando ] || (elem[ expando ] = {});
                        if ( (oldCache = outerCache[ dir ]) &&
                            oldCache[ 0 ] === dirruns && oldCache[ 1 ] === doneName ) {

                            // Assign to newCache so results back-propagate to previous elements
                            return (newCache[ 2 ] = oldCache[ 2 ]);
                        } else {
                            // Reuse newcache so results back-propagate to previous elements
                            outerCache[ dir ] = newCache;

                            // A match means we're done; a fail means we have to keep checking
                            if ( (newCache[ 2 ] = matcher( elem, context, xml )) ) {
                                return true;
                            }
                        }
                    }
                }
        };
}

 

所以此时的matchers的关系是一个层级的包含结构,然后依次这样递归

image

这个地方相当绕!!!!

生成的最后

cached = matcherFromTokens( match[i] );

变成了一个超大的嵌套闭包

 


5: 通过matcherFromGroupMatchers这个函数来生成最终的匹配器

var bySet = setMatchers.length > 0,
        byElement = elementMatchers.length > 0,

        superMatcher = function(seed, context, xml, results, outermost) {
            //分解这个匹配处理器
        }


    return superMatcher

通过matcherFromGroupMatchers的处理最直接的就是能看出,elementMatchers, setMatchers 2个结果不需要再返回出去,直接形成curry的方法,在内部就合并参数

外面就直接调用了,这样

var compileFunc = compiled || compile( selector, match );

compileFunc(
    seed,
    context,
    !documentIsHTML,
    results,
    outermost
);

compileFunc 一直是持有elementMatchers, setMatchers 的引用的,这个设计的手法还是值得借鉴的

 


执行期:

至此之前的5个步骤都是编译成函数处理器的过程,然后就是开始执行了

粗的原理就是把直接分解出来的seed种子合集丢到这个处理器中,然后处理器就会根据各种关系进行分解匹配

从而得到结果集

superMatcher:

while ( (matcher = elementMatchers[j++]) ) {
    if ( matcher( elem, context, xml ) ) {
        results.push( elem );
        break;
    }
}

抽出第一个seed元素,p

然后把p丢到atrr是过滤筛选器中去匹配下,看看是否能找到对应的这个属性

当然还是继续从右往左边匹配过滤了

一次是【name=aaron】 => div => from

matchers[i] => Expr.filter.ATTR =>

p.getAttribute(‘name=aaron’) => 得到结果

function elementMatcher( matchers ) {
    return matchers.length > 1 ?
        function( elem, context, xml ) {
            var i = matchers.length;
            while ( i-- ) {
                if ( !matchers[i]( elem, context, xml ) ) {
                    return false;
                }
            }
            return true;
        } :
        matchers[0];
}

如果匹配失败,自然就退出了  return false ,就不需要在往前找了 ,然后再次递归seed

如果成功,就需要再深入的匹配了

因为是从右到左逐个匹配,所以往前走就会遇到关系选择器的问题,

那么jQuery把四种关系 > + ~ 空的处理给抽出一个具体的方法就是addCombinator

1 "form div > p[name=aaron]"
2 seed => p
3 筛选[name=aaron]
4 > => addCombinator方法 找到对应关系映射的父节点elem
5 elem中去匹配div 递归elementMatcher方法
6 “空” =>  addCombinator方法找到祖先父节点elem
7 elem中去找form为止
 
可见这个查找是及其复杂繁琐的

总结:

sizzle对选择器的大概是思路:

分解所有的选择器为最小单元,从右往左边开始挑出一个浏览器的API能快速定位的元素TAG,ID,CLASS节点,这样就能确定最终的元素跟这个元素是有关系的

然后把剩余的选择器单元开始生成一个匹配器,主要是用来做筛选,最后根据关系分组

如果就依次匹配往上查找,通过关系处理器定位上一个节点的元素,通过普通匹配器去确定是否为可选的内容

posted on 2014-07-21 12:08  【艾伦】  阅读(1763)  评论(5编辑  收藏  举报