HTML DOM节点

在 DOM 树中,基本上一切都是节点。每个元素在最底层上都是 DOM 树中的节点。每个属性都是节点。每段文本都是节点。甚至注释、特殊字符(如版权符号 ©)、DOCTYPE 声明(如果 HTML 或者 XHTML 中有的话)全都是节点。因此在讨论这些具体的类型之前必须清楚地把握什么是节点。

节点是……

用最简单的话说,节点就是 DMO 树中的任何事物。之所以用 “事物” 这个模糊的字眼,是因为只能明确到这个程度。比如 HTML 中的元素(如 img)和 HTML 中的文本片段(如 “Scroll down for more details”)没有多少明显的相似之处。但这是因为您考虑的可能是每种类型的功能,关注的是它们的不同点。

通用节点类型

DOM 代码中最常用的任务就是在页面的 DOM 树中导航。比方说,可以通过其 “id” 属性定位一个 form,然后开始处理那个 form 中内嵌的元素和文本。其中可能包含文字说明、输入字段的标签、真正的 input 元素,以及其他 HTML 元素(如 img)和链接(a 元素)。如果元素和文本是完全不同的类型,就必须为每种类型编写完全不同的代码。

DOM 节点的属性主要有:

  • nodeName 报告节点的名称。
  • nodeValue 提供节点的 “值”。
  • parentNode 返回节点的父节点。记住,每个元素、属性和文本都有一个父节点。
  • childNodes 是节点的孩子节点列表。对于 HTML,该列表仅对元素有意义,文本节点和属性节点都没有孩子。
  • firstChild 仅仅是 childNodes 列表中第一个节点的快捷方式。
  • lastChild 是另一种快捷方式,表示 childNodes 列表中的最后一个节点。
  • previousSibling 返回当前节点之前 的节点。换句话说,它返回当前节点的父节点的 childNodes 列表中位于该节点前面的那个节点(如果感到迷惑,重新读前面一句)。
  • nextSibling 类似于 previousSibling 属性,返回父节点的 childNodes 列表中的下一个节点。
  • attributes 仅用于元素节点,返回元素的属性列表。

接下来看看所有节点都具有的方法(与节点属性一样,我省略了实际上不适用于多数 HTML DOM 操作的少数方法):

  • insertBefore(newChild, referenceNode) 将 newChild 节点插入到 referenceNode 之前。记住,应该对newChild 的目标父节点调用该方法。
  • replaceChild(newChild, oldChild) 用 newChild 节点替换 oldChild 节点。
  • removeChild(oldChild) 从运行该方法的节点中删除 oldChild 节点。
  • a(newChild) 将 newChild 添加到运行该函数的节点之中。newChild 被添加到目标节点孩子列表中的末端
  • hasChildNodes() 在调用该方法的节点有孩子时则返回 true,否则返回 false。
  • hasAttributes() 在调用该方法的节点有属性时则返回 true,否则返回 false。

通用节点类型

多数 Web 应用程序中只用到四种节点类型:

    * 文档节点表示整个 HTML 文档。
    * 元素节点表示 HTML 元素,如 a 或 img。
    * 属性节点表示 HTML 元素的属性,如 href(a 元素)或 src(img 元素)。
    * 文本节点表示 HTML 文档中的文本,如 “Click on the link below for a complete set list”。这是出现在 p、a 或 h2 这些元素中的文字。

文档节点

基本上所有基于 DOM 的代码中都要用到的第一个节点类型是文档节点。文档节点 实际上并不是 HTML(或 XML)页面中的一个元素而是页面本身。因此在 HTML Web 页面中,文档节点就是整个 DOM 树。在 JavaScript 中,可以使用关键字 document 访问文档节点:
var myDocument = document;
var htmlElement = myDocument.documentElement;

JavaScript 中的 document 关键字返回当前网页的 DOM 树。从这里可以开始处理树中的所有节点。
也可使用 document 对象创建新节点,如下所示:
    * createElement_x_x(elementName) 使用给定的名称创建一个元素。
    * createTextNode(text) 使用提供的文本创建一个新的文本节点。
    * createAttribute(attributeName) 用提供的名称创建一个新属性。

这里的关键在于这些方法创建节点,但是并没有将其附加或者插入到特定的文档中。因此,必须使用前面所述的方法如 insertBefore() 或 a() 来完成这一步。因此,可使用下面的代码创建新元素并将其添加到文档中:

var pElement = mydocument.create_rElement_x("p");
var text = mydocument.create_rTextNode("Here's some text in a p element.");
pElement.a(text);
bodyElement.a(pElement);


一旦使用 document 元素获得对 Web 页面 DOM 树的访问,就可以直接使用元素、属性和文本了。

元素节点

虽然会大量使用元素节点,但很多需要对元素执行的操作都是所有节点共有的方法和属性,而不是元素特有的方法和属性。元素只有两组专有的方法:

   1. 与属性处理有关的方法:
          * getAttribute(name) 返回名为 name 的属性值。
          * removeAttribute(name) 删除名为 name 的属性。
          * setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。
          * getAttributeNode(name) 返回名为 name 的属性节点(属性节点在 下一节 介绍)。
          * removeAttributeNode(node) 删除与指定节点匹配的属性节点。
   2. 与查找嵌套元素有关的方法:
          * getElementsByTagName_r(elementName) 返回具有指定名称的元素节点列表。

处理属性

处理元素很简单,比如可用 document 对象和上述方法创建一个新的 img 元素:

var imgElement = document.create_rElement_x("img");
imgElement.setAttribute("src", "http://www.headfirstlabs.com/Images/hraj_cover-150.jpg");
imgElement.setAttribute("width", "130");
imgElement.setAttribute("height", "150");
bodyElement.a(imgElement);


现在看起来应该非常简单了。实际上,只要理解了节点的概念并知道有哪些方法可用,就会发现在 Web 页面和 JavaScript 代码中处理 DOM 非常简单。在上述代码中,JavaScript 创建了一个新的 img 元素,设置了一些属性然后添加到 HTML 页面的 body 元素中。

查找嵌套元素

发现嵌套的元素很容易。比如,下面的代码用于发现和删除 清单 3 所示 HTML 页面中的所有 img 元素:

      // Remove all the top-level <img> elements in the body
      if (bodyElement.hasChildNodes()) {
        for (i=0; i<bodyElement.childNodes.length; i++) {
          var currentNode = bodyElement.childNodes[i];
          if (currentNode.nodeName.toLowerCase() == "img") {
            bodyElement.removeChild(currentNode);
          }
        }
      }

也可以使用 getElementsByTagName_r() 完成类似的功能:

属性节点

DOM 将属性表示成节点,可以通过元素的 attributes 来访问元素的属性.需要指出的是,attributes 属性实际上是对节点类型而非局限于元素类型来说的。有点古怪,不影响您编写代码,但是仍然有必要知道这一点。

虽然也能使用属性节点,但通常使用元素类的方法处理属性更简单。其中包括:

    * getAttribute(name) 返回名为 name 的属性值。
    * removeAttribute(name) 删除名为 name 的属性。
    * setAttribute(name, value) 创建一个名为 name 的属性并将其值设为 value。

这三个方法不需要直接处理属性节点。但允许使用简单的字符串属性设置和删除属性及其值。


文本节点

需要考虑的最后一种节点是文本节点(至少在处理 HTML DOM 树的时候如此)。基本上通常用于处理文本节点的所有属性都属于节点对象。实际上,一般使用 nodeValue 属性来访问文本节点的文本,少数其他几种方法是专门用于文本节点的。这些方法用于增加或分解节点中的数据:

    * appendData(text) 将提供的文本追加到文本节点的已有内容之后。
    * insertData(position, text) 允许在文本节点的中间插入数据。在指定的位置插入提供的文本。
    * replaceData(position, length, text) 从指定位置开始删除指定长度的字符,用提供的文本代替删除的文本。

什么节点类型?

到目前为止看到的多数代码都假设已经知道处理的节点是什么类型,但情况并非总是如此。比方说,如果在 DOM 树中导航并处理一般的节点类型,可能就不知道您遇到了元素还是文本。也许获得了 p 元素的所有孩子,但是不能确定处理的是文本、b 元素还是 img 元素。这种情况下,在进一步的处理之前需要确定是什么类型的节点。

所幸的是很容易就能做到。DOM 节点类型定义了一些常量,比如:

   1. Node.ELEMENT_NODE 是表示元素节点类型的常量。
   2. Node.ATTRIBUTE_NODE 是表示属性节点类型的常量。
   3. Node.TEXT_NODE 是表示文本节点类型的常量。
   4. Node.DOCUMENT_NODE 是表示文档节点类型的常量。

还有其他一些节点类型,但是对于 HTML 除了这四种以外很少用到。我有意没有给出这些常量的值,虽然 DOM 规范中定义了这些值,永远不要直接使用那些值,因为这正是常量的目的!

nodeType 属性

可使用 nodeType 属性比较节点和上述常量 —— 该属性定义在 DOM node 类型上因此可用于所有节点,得到节点的类型非常简单。更有挑战性的是知道节点的类型之后确定能做什么,只要掌握了节点、文本、属性和元素类型提供了什么属性和方法,就可以自己进行 DOM 编程了。

posted @ 2015-07-31 14:36  __夜风  阅读(281)  评论(0编辑  收藏  举报