DOM中的动态NodeList与静态NodeList

GitHub版本号: https://github.com/cncounter/translation/blob/master/tiemao_2014/NodeList/NodeList.md

副标题: 为何getElementsByTagName()比querySelectorAll()快100倍

昨天,我在雅虎的同事 Scott Schiller (斯科特·席勒, 同一时候也是SoundManager创造者) 发Twitter询问为何getElementsByTagName("a") 在全部浏览器上都比 querySelectorAll("a") 要快好多倍。 有一个 专门的 JSPerf測试页面, 通过对照就能发现两者的速度差异相当明显。 比方作者在Windows XP下使用的 Firefox 3.6.8 浏览器,querySelectorAll("a") 比 getElementsByTagName("a") 的运行速度要低98%. 我和 Scott, 以及 YUI团队的 Ryan Grove 有一个活跃的Twitter-sation, 关于这样的现象的原因,以及情理之中让人沮丧的结果。 我想好好地解释说明下究竟为什么会发生这样的情况,以及为什么未来也可能不会改变。

在深入细节之前须要了解这两个方法间一个非常重要的差别,我想说的并非他们接收的參数一个是标签名,还有一个是整个CSS选择器。

而其最大的差别在于返回值的不同getElementsByTagName() 方法返回一个动态的(live) NodeList, 而querySelectorAll() 返回的是一个静态的(static) NodeList. 理解这一点是非常必要的.

动态 NodeList

这是文档对象模型(DOM,Document Object Model)中的一个大坑. NodeList 对象(以及 HTML DOM 中的 HTMLCollection对象)是一种特殊类型的对象. DOM Level 3 spec 规范 对 HTMLCollection 对象的描写叙述例如以下:

DOM中的 NodeList 和 NamedNodeMap 对象是动态的(live); 也就是说,对底层文档结构的改动会动态地反映到相关的集合NodeList 和 NamedNodeMap 中。 比如, 假设先获取了某个元素(Element)的子元素的动态集合 NodeList 对象, 然后又在其它地方顺序加入很多其它子元素到这个DOM父元素中( 能够说加入, 改动, 删除子元素等操作), 这些更改将自己主动反射到NodeList, 不须要手动进行其它调用. 相同地, 对DOM树上某个Node节点的改动,也会实时影响引用了该节点的 NodeList和 NamedNodeMap 对象。

getElementsByTagName() 方法返回相应标签名的元素的一个动态集合, 仅仅要document发生变化,就会自己主动更新相应的元素。

因此, 以下的代码实际上是一个死循环:

// XXX 实际中请注意... 
// 适当的中间变量是一个好习惯
var divs = document.getElementsByTagName("div");
var i=0;

while(i < divs.length){
    document.body.appendChild(document.createElement("div"));
    i++;
}

死循环的原因是每次循环都会又一次计算 divs.length. 每次迭代都会加入一个新的 <div>, 所以每次 i++ ,相应的divs.length 也在添加, 所以 i 永远比divs.length小, 循环终止条件也就不会触发[例外情况是dom中没有div,不进入循环]。

你可能会认为这样的动态集合是个坏主意, 但通过动态集合能够保证某些使用非常普遍的对象在各种情况下都是同一个, 如document.images , document.forms, 以及其它相似的 pre-DOM集合。

静态 NodeList

querySelectorAll() 方法的不同是它返回一个静态的 NodeList. 这是表示的 选择器API规范 :

querySelectorAll() 方法返回的 NodeList 对象必须是静态的, 而不能是动态的([DOM-LEVEL-3-CORE], section 1.1.1). 兴许对底层document的更改不能影响到返回的这个 NodeList 对象. 这意味着返回的对象将包括在创建列表那一刻匹配的全部元素节点。

所以即便是让 querySelectorAll() 和 getElementsByTagName() 具有相同的參数和行为, 他们也是有非常大的不同点。 在前一种情况下, 返回的 NodeList 就是方法被调用时刻的文档状态的快照, 而后者总是会随时依据document的状态而更新。

以下的代码就不会是死循环:

var divs = document.querySelectorAll("div"),
    i=0;

while(i < divs.length){
    document.body.appendChild(document.createElement("div"));
    i++;
}

在这样的情况下没有死循环, divs.length的值永远不会改变, 所以循环实际上就是将 <div> 元素的数量添加一倍, 然后就退出循环。

为什么动态 NodeList 更快呢?

动态 NodeList 对象在浏览器中能够更快地被创建并返回,由于他们不须要预先获取全部的信息, 而静态 NodeList 从一開始就须要取得并封装全部相关数据. 再三强调要彻底了解这一点, WebKit 的源代码中对每种 NodeList 类型都有一个单独的源文件: DynamicNodeList.cpp 和 StaticNodeList.cpp. 两种对象类型的创建方式是全然不同的。

DynamicNodeList 对象通过在cache缓存中 注冊它的存在 并创建。 从本质上讲, 创建一个新的 DynamicNodeList 是非常轻量级的, 由于不须要做不论什么前期工作。 每次訪问 DynamicNodeList 时, 必须查询 document 的变化, length 属性 以及 item() 方法证明了这一点(使用中括号的方式訪问也是一样的).

相比之下, StaticNodeList 对象实例由还有一个文件创建,然后循环填充全部的数据 。 在 document 中运行静态查询的前期成本上比起 DynamicNodeList 要显著提高非常多倍。

假设真正的查看WebKit的源代码,你会发现他为 querySelectorAll() 明白地 创建一个返回对象 ,在当中又使用一个循环来获取每个结果,并创建终于返回的一个 NodeList.

结论

getElementsByTagName() 速度比 querySelectorAll() 快的根本原因在于动态NodeList静态NodeList对象的不同。 虽然我能够肯定地说有某种方法来优化这一点, 在获取NodeList时不须要运行非常多前期处理操作的动态列表,总比获取静态的集合(返回之前完毕各种处理)要快非常多。 哪个方法更好用主要还是看你的需求, 假设仅仅是要依据 tag name 来查找元素, 也不须要获取此一个快照, 那就应该使用 getElementsByTagName()方法; 假设须要快照结果(静态),或者须要使用复杂的CSS查询, 则能够考虑 querySelectorAll()

原文链接: Why is getElementsByTagName() faster than querySelectorAll()?

原文日期: 2010-09-28

翻译日期: 2014-11-13

标签: getElementsByTagNameJavaScriptNodeListquerySelectorAll


posted @ 2015-12-28 19:45  zfyouxi  阅读(497)  评论(0编辑  收藏  举报