jQuery-1.9.1源码分析系列(三) Sizzle选择器引擎——一些有用的Sizzle API

  说一下Sizzle中零碎的API。这些API有的被jQuery接管,直接使用jQuery.xxx就可以使用,有的没有被接管,如果要在jQuery中使用,使用方法是jQuery.find.xxx。

  具体看一下有哪些API

//筛选出elements满足CSS选择器表达式expr的节点【最终返回的是节点数组】
Sizzle.matches = function( expr, elements ) {...}

//判断dom元素elem是否匹配CSS选择器表达式expr
Sizzle.matchesSelector = function( elem, expr ) {...}


//被jQuery接管的部分API
jQuery.find = Sizzle;//查找函数 jQuery.unique = Sizzle.uniqueSort;//根据DOM元素在文档中出现的先后顺序对DOM元素数组进行排序,并移除重复的元素 jQuery.text = Sizzle.getText;//获取节点elem下的所有文本内容【包括标签之间的空白】 jQuery.isXMLDoc = Sizzle.isXML;//判断DOM节点是否位于XML文档中,或者其本身就是XML文档 jQuery.contains = Sizzle.contains;//用于判断指定元素内是否包含另一个元素

  接下来一一分析(jQuery.find就不分析了)。

 

Sizzle.contains(forefather,posterity):用于判断指定元素内是否包含另一个元素

  通俗的来讲,即是判断某一个DOM节点posterity是否是forefather后代节点

  源码比较简单,处理过程是如果能通过浏览器自带的docElem.contains或docElem.compareDocumentPosition来处理则使用之;否则一直查找posterity节点的parentNode和forefather节点比较,如果找到和forefather相同的节点则返回true,否则返回false。

  所以,这里关键的地方是浏览器的原生函数docElem.contains或docElem.compareDocumentPosition。

  docElem.contains(docNode):判断节点docNode是否包含在docElem中。【需要注意:当docNode和docElem是同一个节点的时候也返回true。这是和Sizzle.contains不同的地方】。这个方法并没有标准化,期初用于IE,但是现代的浏览器都实现了这个功能。

  docElem.compareDocumentPosition(docNode):返回一个比特码用于确定docElem和docNode两个节点之间的位置关系。这个函数是DOM3标准的一部分。现代浏览器(IE9+,firefox)都支持该方法。

  比较结果对应的描述如下

Bits Number         Meaning 
000000 0 元素相同
000001 1 节点在不同的文档
000010 2 docNode在docElem之前
000100 4 docNode在docElem之后
001000 8 docNode包含docElem
010000 16 docNode被docElem包含
100000 32 占位(浏览器私有使用)

  docElem.compareDocumentPosition(docNode)的得到的结果应当是符合的比特位相加

  比如:

    <div id="demo">
      <div category="children"><span></span></div>
      <div category="cooking"></div>
      <div category="web" cover="paperback"></div>
      <div category="web"></div>
    </div>

  js:

var xmlDoc = document.getElementById('demo');
var a=xmlDoc.getElementsByTagName('p')[0]; var b=xmlDoc.getElementsByTagName('span')[0]; document.write("<br> Number of compareDocumentPosition: " +a.compareDocumentPosition(b));

  首先b在a后面,所以符合这个条件的比特值是4;其次b被a包含,符合这个条件的比特值为16。a.compareDocumentPosition(b)的最终结果是4 + 16 = 20,比特值为010100;考虑各种浏览器的兼容情况,所以a.compareDocumentPosition( bup ) & 16的结果就是a是否包含bup的结果。

 

  说到比较节点位置关系需要知道一些东东。XML 经常在节点之间含有换行或空白字符。这是在使用简单的编辑器(比如记事本)时经常出现的情况。比如下面的例子

  现代浏览器(Firefox,chrome,IE9+)会把空的空白或换行作为文本节点来处理

var xmlDoc = document.getElementById('demo');  
var x=xmlDoc.childNodes; document.write("Number of child nodes: " + x.length);//Number of child nodes: 9

  但是IE8-浏览器不会这样,浏览器会忽略元素节点之间的空文本节点。这个时候获取到的节点数量不是为9,而是4。

  比较好的状况是docElem.compareDocumentPosition只有现代浏览器才支持,所以在支持docElem.compareDocumentPosition的情况,各个浏览器比较结果都应该是相同的。

 

Sizzle.uniqueSort(domArray):根据DOM元素在文档中出现的先后顺序对DOM元素数组进行排序,并移除重复的元素

   参数domArray只能是DOM元素数组。并且重复的元素指的是同一个节点(使用“===”比较)。

  去重不是难点。在去重之前需要对节点进行排序。使用数组的sort方法。

  

  这里讲一讲sort的使用:

  语法:arrayObject.sort(sortby)

  参数:sortby必须是函数,用来规定排序顺序,可选

  返回值:对数组(原数组,不生成副本)的引用。

  说明:如果没有使用参数,将按字母顺序对数组中的元素进行排序。内部实现——应把数组的元素都转换成字符串(如有必要)来进行比较。如果提供比较函数,该函数要比较两个值,然后返回一个用于说明这两个值的相对顺序的数字。

  比较函数应该具有两个参数 a 和 b,其返回值如下:

  • 若 a 小于 b,在排序后的数组中 a 应该出现在 b 之前,则返回一个小于 0 的值,即a-b应当为负值。
  • 若 a 等于 b,则返回 0。
  • 若 a 大于 b,在排序后的数组中 a 应该出现在 b 之后,则返回一个大于 0 的值,即a - b为正值。

  

  明白了排序函数以后,我们明白,因为参数是DOM节点数组,不可能使用默认的排序方式,我们必须自定义比较函数sorby。

  前面我们分析了浏览器原生方法docElem.compareDocumentPosition,这个函数就是用来判断节点关系的最好方法了。如果能使用这个函数,我们的比较函数可以是

function( a, b ) {
    var compare;

    if ( a === b ) {return 0;
    }

    if ( (compare = b.compareDocumentPosition && a.compareDocumentPosition && a.compareDocumentPosition( b )) ) {
    //如果b在a后面,那么compare的比特位至少是0?0100,?表示可能是0,也可能是1
    
return compare & 4 ? -1 : 1; }   //最后的容错处理,如果节点a不包含compareDocumentPosition方法,我们认为是非法节点,直接放在数组最后。 return a.compareDocumentPosition ? -1 : 1; }

  但是有一个中特殊情况:a和b不再同一个文档内。那么就看a、b节点哪个不在当前文档内那么哪个节点就应该放在最后。这部分的判断如下

        if ( compare & 1 || a.parentNode && a.parentNode.nodeType === 11 ) {
       //a就是当前文档或是在window.document中,则需将b放在数组最后
if ( a === doc || contains( preferredDoc, a ) ) { return -1; }
       //b就是当前文档或是在window.document中,则需要将a放在数组最后
if ( b === doc || contains( preferredDoc, b ) ) { return 1; } return 0; }

  

  如果不能使用docElem.compareDocumentPosition,判断就稍微复杂一些。但是也可以做一些快速判断,比如相同的节点、互为兄弟节点、某个节点是document或节点已经失去连接,这些情况可以先做判断

                if ( a === b ) {
                    hasDuplicate = true;
                    return 0;

                // 没有父母的节点或者是document节点或断开连接的节点(失联的节点没有parentNode)
                } else if ( !aup || !bup ) {
                    return a === doc ? -1 :
                    b === doc ? 1 :
                    aup ? -1 :
                    bup ? 1 :
                    0;

                    // 如果是兄弟节点,则快速检测
                } else if ( aup === bup ) {
                    return siblingCheck( a, b );
                }

  其他情况只能是从DOM的根节点开始判断a和b属于那个分支,比较分支的先后即可。这里面jQuery做的非常巧妙,将a和b的祖先节点分别压入ap和bp。注意压入顺序是将越是靠近根节点的祖先节点放在数组的最前面。

         // 否则,我们需要他们的祖先比较完整列表
                cur = a;
                while ( (cur = cur.parentNode) ) {
                    ap.unshift( cur );
                }
                cur = b;
                while ( (cur = cur.parentNode) ) {
                    bp.unshift( cur );
                }

  结果形成的ap/bp为如下

  ap = [#document节点,html节点,body节点,...]

  bp = [#document节点,html节点,body节点,...]

  从ap和bp的前半部分都是相同的,从某个下标index开始,ap[index]和bp[index]不同。很明显,ap[index]和bp[index]是兄弟节点,我们只需要比较ap[index]和bp[index]的谁在前,那么a和b中谁就在前。那么,判断的代码应该如下  

                // 从树根节点开始往下找差异
                while ( ap[i] === bp[i] ) {
                    i++;
                }

                return i ?
                    // 如果节点有一个共同的祖先,做一个同级检查
                    siblingCheck( ap[i], bp[i] ) :0;

  但是这里还存在一个问题:如果a或b不再文档内呢?所以这里还要加上这个部分的判断代码。所以最终这个对比函数的源码为

function( a, b ) {
    var cur,
    i = 0,
    aup = a.parentNode,
    bup = b.parentNode,
    ap = [ a ],
    bp = [ b ];

    if ( a === b ) {
        hasDuplicate = true;
        return 0;

    // 没有父母的节点或者是document节点或断开连接的节点(失联的节点没有parentNode)
    } else if ( !aup || !bup ) {
        return a === doc ? -1 :
        b === doc ? 1 :
        aup ? -1 :
        bup ? 1 :
        0;

        // 如果是兄弟节点,则快速检测
    } else if ( aup === bup ) {
        return siblingCheck( a, b );
    }

    // 否则,我们需要他们的祖先比较完整列表
    cur = a;
    while ( (cur = cur.parentNode) ) {
        ap.unshift( cur );
    }
    cur = b;
    while ( (cur = cur.parentNode) ) {
        bp.unshift( cur );
    }

    // 从树根节点开始往下找差异
    while ( ap[i] === bp[i] ) {
        i++;
    }

    return i ?
        // 如果节点有一个共同的祖先,做一个同级检查
        siblingCheck( ap[i], bp[i] ) :

        // 否则节点在我们的文档内的排在前面
        ap[i] === preferredDoc ? -1 :
        bp[i] === preferredDoc ? 1 :
        0;
}

 

Sizzle.getText(elem):获取节点elem下的所有文本内容【包括标签之间的空白】

  参数elem可以是一个节点,也可以是及节点数组。

  这部分代码比较简单。主要注意的是兼容性问题。docElem.textContent获取内容是正确的,但是并非所有的浏览器都支持该方法,比如IE8-。而IE支持的innerText方法有问题:该方法会自动给两个标签之间加空格。

  比如  

<ul id="myList"><li id="item1">Coffee<div>sdddddddddd</div></li><li id="item2">Tea</li></ul>
<script>
function myFunction()
{
  var lst = document.getElementById("myList");
  var x = lst.textContent ;//CoffeesddddddddddTea
  var y =lst.innerText;//Coffee sdddddddddd Tea }
myFunction();
</script>

  所以,不能使用innerText来替代。没办法,IE8-只能使用文本节点的docElem.nodeValue方法获取单个文本节点了:将elem下所有文本节点的nodeValue相加。

  完整源码如下:  

getText = Sizzle.getText = function( elem ) {
     var node,
     ret = "",
     i = 0,
     nodeType = elem.nodeType;

     if ( !nodeType ) {
        // 如果没有nodeType, 这预计是一个数组
        for ( ; (node = elem[i]); i++ ) {
            // 不经过注释节点
            ret += getText( node );
        }
    //element、document、DocumentFragment节点
    } else if ( nodeType === 1 || nodeType === 9 || nodeType === 11 ) {
        // 使用textContent来获取
        // 使用innerText属性删除了新线的一致性 (see #11153)
        if ( typeof elem.textContent === "string" ) {
            return elem.textContent;
        } else {
            // 遍历其子节点
            for ( elem = elem.firstChild; elem; elem = elem.nextSibling ) {
                ret += getText( elem );
            }
        }
    //Text、CDATASection(不会由解析器解析的文本)
    } else if ( nodeType === 3 || nodeType === 4 ) {
        return elem.nodeValue;
    }
    //不包括注释或处理指令节点

    return ret;
};

 

Sizzle.isXML(elem):判断DOM节点是否位于XML文档中,或者其本身就是XML文档

  该函数主要用于判断指定文档是一个XML文档还是一个HTML(或XHTML)文档。这个判断比较简单,直接附上源码

     Sizzle.isXML = function( elem ) {
            // documentElement的判断方式在他不存在的时候是可靠的
            // (如在IE浏览器加载内置iframe- #4833)
            var documentElement = elem && (elem.ownerDocument || elem).documentElement;
            return documentElement ? documentElement.nodeName !== "HTML" : false;
        };

 

Sizzle.matches( expr, elements):筛选出elements满足CSS选择器表达式expr的节点【最终返回的是节点数组】。

  实现比较简单啦,上源码

        Sizzle.matches = function( expr, elements ) {
            return Sizzle( expr, null, null, elements );
        };

 

Sizzle.matchesSelector(elem, expr):判断dom元素elem是否匹配CSS选择器表达式expr

  现代浏览器(IE9+,firefox,chrome等)都支持原生的docElem.matchesSelector,只不过带上来各自对前缀。OK哪就简单了,尽量使用浏览器原生的方法,如果不行再使用Sizzle()方法从备选种子elem中获取满足表达式expr的结果来判断。需要注意的是IE9虽然也支持msMatchesSelector,但是在失联的节点上会返回false,所以此时也使用Sizzle来处理。源码如下

        Sizzle.matchesSelector = function( elem, expr ) {
            // Set document vars if needed
            if ( ( elem.ownerDocument || elem ) !== document ) {
                setDocument( elem );
            }

            //rattributeQuotes = /\=[\x20\t\r\n\f]*([^'"\]]*)[\x20\t\r\n\f]*\]/g
            // 确保属性选择器正确
            expr = expr.replace( rattributeQuotes, "='$1']" );

            //rbuggyMatches = /(?:)/
            //rbuggyQSA总是包含 :focus,所以没有必要做存在确认
            if ( support.matchesSelector && !documentIsXML && (!rbuggyMatches || !rbuggyMatches.test(expr)) && !rbuggyQSA.test(expr) ) {
                try {
                    var ret = matches.call( elem, expr );

                    // IE9 matchesSelector在断开连接(不再document上)节点会返回false
                    if ( ret || support.disconnectedMatch ||
                            //同时,在IE9上,断开连接的节点被认为是一个文档片段
                            elem.document && elem.document.nodeType !== 11 ) {
                        return ret;
                    }
                } catch(e) {}
            }

            return Sizzle( expr, document, null, [elem] ).length > 0;
        };

  

  

posted @ 2015-11-11 17:07  chua1989  阅读(1173)  评论(0编辑  收藏  举报