10.1.2 Document类型【JavaScript高级程序设计第三版】

JavaScript 通过Document 类型表示文档。在浏览器中,document 对象是HTMLDocument(继承自Document 类型)的一个实例,表示整个HTML 页面。而且,document 对象是window 对象的一个属性,因此可以将其作为全局对象来访问。Document 节点具有下列特征:

  • nodeType 的值为9;
  • nodeName 的值为"#document";
  • nodeValue 的值为null;
  • parentNode 的值为null;
  • ownerDocument 的值为 null;
  • 其子节点可能是一个DocumentType(最多一个)、Element(最多一个)、ProcessingInstruction或Comment。

Document 类型可以表示HTML 页面或者其他基于XML 的文档。不过,最常见的应用还是作为HTMLDocument 实例的document 对象。通过这个文档对象,不仅可以取得与页面有关的信息,而且还能操作页面的外观及其底层结构。

在Firefox、Safari、Chrome 和Opera 中,可以通过脚本访问Document 类型的构造函数和原型。但在所有浏览器中都可以访问HTMLDocument 类型的构造函数和原型,包括IE8 及后续版本。

1. 文档的子节点

虽然DOM 标准规定Document 节点的子节点可以是DocumentType、Element、ProcessingInstruction或Comment,但还有两个内置的访问其子节点的快捷方式。第一个就是documentElement属性,该属性始终指向HTML 页面中的<html>元素。另一个就是通过childNodes 列表访问文档元素,但通过documentElement 属性则能更快捷、更直接地访问该元素。以下面这个简单的页面为例。

<html>
	<body>
	</body>
</html>

这个页面在经过浏览器解析后,其文档中只包含一个子节点,即<html>元素。可以通过documentElement 或childNodes 列表来访问这个元素,如下所示。

var html = document.documentElement; //取得对<html>的引用
alert(html === document.childNodes[0]); //true
alert(html === document.firstChild); //true

这个例子说明,documentElement、firstChild 和childNodes[0]的值相同,都指向<html>元素。

作为HTMLDocument 的实例,document 对象还有一个body 属性,直接指向<body>元素。因为开发人员经常要使用这个元素,所以document.body 在JavaScript 代码中出现的频率非常高,其用法如下。

var body = document.body; //取得对<body>的引用

所有浏览器都支持document.documentElement 和document.body 属性。Document 另一个可能的子节点是DocumentType。通常将<!DOCTYPE>标签看成一个与文档其他部分不同的实体,可以通过doctype 属性(在浏览器中是document.doctype)来访问它的信息。

var doctype = document.doctype; //取得对<!DOCTYPE>的引用

浏览器对document.doctype 的支持差别很大,可以给出如下总结。

  • IE8 及之前版本:如果存在文档类型声明,会将其错误地解释为一个注释并把它当作Comment节点;而document.doctype 的值始终为null。
  • IE9+及Firefox:如果存在文档类型声明,则将其作为文档的第一个子节点;document.doctype是一个DocumentType 节点,也可以通过document.firstChild 或document.childNodes[0]访问同一个节点。
  • Safari、Chrome 和Opera:如果存在文档类型声明,则将其解析,但不作为文档的子节点。document.doctype 是一个DocumentType 节点,但该节点不会出现在document.childNodes 中。

由于浏览器对document.doctype 的支持不一致,因此这个属性的用处很有限。
从技术上说,出现在<html>元素外部的注释应该算是文档的子节点。然而,不同的浏览器在是否解析这些注释以及能否正确处理它们等方面,也存在很大差异。以下面简单的HTML 页面为例。

<!--第一条注释 -->
<html>
	<body>
	</body>
</html>
<!--第二条注释 -->

看起来这个页面应该有3 个子节点:注释、<html>元素、注释。从逻辑上讲,我们会认为document.childNodes 中应该包含与这3 个节点对应的3 项。但是,现实中的浏览器在处理位于<html>外部的注释方面存在如下差异。

  • IE8 及之前版本、Safari 3.1 及更高版本、Opera 和Chrome 只为第一条注释创建节点,不为第二条注释创建节点。结果,第一条注释就会成为document.childNodes 中的第一个子节点。
  • IE9 及更高版本会将第一条注释创建为document.childNodes 中的一个注释节点,也会将第二条注释创建为document.childNodes 中的注释子节点。
  • Firefox 以及Safari 3.1 之前的版本会完全忽略这两条注释。

同样,浏览器间的这种不一致性也导致了位于<html>元素外部的注释没有什么用处。多数情况下,我们都用不着在document 对象上调用appendChild()、removeChild()和replaceChild()方法,因为文档类型(如果存在的话)是只读的,而且它只能有一个元素子节点(该节点通常早就已经存在了)。

2. 文档信息

作为HTMLDocument 的一个实例,document 对象还有一些标准的Document 对象所没有的属性。

这些属性提供了document 对象所表现的网页的一些信息。其中第一个属性就是title,包含着<title>元素中的文本——显示在浏览器窗口的标题栏或标签页上。通过这个属性可以取得当前页面的标题,也可以修改当前页面的标题并反映在浏览器的标题栏中。修改title 属性的值不会改变<title>元素。来看下面的例子。

//取得文档标题
var originalTitle = document.title;
//设置文档标题
document.title = "New page title";

接下来要介绍的3 个属性都与对网页的请求有关,它们是URL、domain 和referrer。URL 属性中包含页面完整的URL(即地址栏中显示的URL),domain 属性中只包含页面的域名,而referrer属性中则保存着链接到当前页面的那个页面的URL。在没有来源页面的情况下,referrer 属性中可能会包含空字符串。所有这些信息都存在于请求的HTTP 头部,只不过是通过这些属性让我们能够在JavaScrip 中访问它们而已,如下面的例子所示。

//取得完整的URL
var url = document.URL;
//取得域名
var domain = document.domain;
//取得来源页面的URL
var referrer = document.referrer;

URL 与domain 属性是相互关联的。例如,如果document.URL 等于http://www.wrox.com/WileyCDA/,那么document.domain 就等于www.wrox.com。

在这3 个属性中,只有domain 是可以设置的。但由于安全方面的限制,也并非可以给domain 设置任何值。如果URL 中包含一个子域名,例如p2p.wrox.com,那么就只能将domain 设置为"wrox.com"(URL 中包含"www",如www.wrox.com 时,也是如此)。不能将这个属性设置为URL 中不包含的域,如下面的例子所示。

//假设页面来自p2p.wrox.com 域
document.domain = "wrox.com"; // 成功
document.domain = "nczonline.net"; // 出错!

当页面中包含来自其他子域的框架或内嵌框架时,能够设置document.domain 就非常方便了。由于跨域安全限制, 来自不同子域的页面无法通过JavaScript 通信。而通过将每个页面的document.domain 设置为相同的值,这些页面就可以互相访问对方包含的JavaScript 对象了。例如,假设有一个页面加载自www.wrox.com,其中包含一个内嵌框架,框架内的页面加载自p2p.wrox.com。

由于document.domain 字符串不一样,内外两个页面之间无法相互访问对方的JavaScript 对象。但如果将这两个页面的document.domain 值都设置为"wrox.com",它们之间就可以通信了。

浏览器对domain 属性还有一个限制,即如果域名一开始是“松散的”(loose),那么不能将它再设置为“紧绷的”(tight)。换句话说,在将document.domain 设置为"wrox.com"之后,就不能再将其设置回"p2p.wrox.com",否则将会导致错误,如下面的例子所示。

//假设页面来自于p2p.wrox.com 域
document.domain = "wrox.com"; //松散的(成功)
document.domain = "p2p.wrox.com"; //紧绷的(出错!)

所有浏览器中都存在这个限制,但IE8 是实现这一限制的最早的IE 版本。

3. 查找元素

说到最常见的DOM 应用,恐怕就要数取得特定的某个或某组元素的引用,然后再执行一些操作了。

取得元素的操作可以使用document 对象的几个方法来完成。其中,Document 类型为此提供了两个方法:getElementById()和getElementsByTagName()。

第一个方法,getElementById(),接收一个参数:要取得的元素的ID。如果找到相应的元素则返回该元素,如果不存在带有相应ID 的元素,则返回null。注意,这里的ID 必须与页面中元素的id特性(attribute)严格匹配,包括大小写。以下面的元素为例。

<div id="myDiv">Some text</div>

可以使用下面的代码取得这个元素:

var div = document.getElementById("myDiv"); //取得<div>元素的引用

但是,下面的代码在除IE7 及更早版本之外的所有浏览器中都将返回null。var div = document.getElementById("mydiv"); //无效的ID(在IE7 及更早版本中可以)IE8 及较低版本不区分ID 的大小写,因此"myDiv"和"mydiv"会被当作相同的元素ID。如果页面中多个元素的ID 值相同,getElementById()只返回文档中第一次出现的元素。IE7 及较低版本还为此方法添加了一个有意思的“怪癖”:name 特性与给定ID 匹配的表单元素(<input>、<textarea>、<button>及<select>)也会被该方法返回。如果有哪个表单元素的name 特性等于指定的ID,而且该元素在文档中位于带有给定ID 的元素前面,那么IE 就会返回那个表单元素。来看下面的例子。

<input type="text" name="myElement" value="Text field">
<div id="myElement">A div</div>

基于这段HTML 代码,在IE7 中调用document.getElementById("myElement "),结果会返回<input>元素;而在其他所有浏览器中,都会返回对<div>元素的引用。为了避免IE 中存在的这个问题,最好的办法是不让表单字段的name 特性与其他元素的ID 相同。另一个常用于取得元素引用的方法是getElementsByTagName()。这个方法接受一个参数,即要取得元素的标签名,而返回的是包含零或多个元素的NodeList。在HTML 文档中,这个方法会返回一个HTMLCollection 对象,作为一个“动态”集合,该对象与NodeList 非常类似。例如,下列代码会取得页面中所有的<img>元素,并返回一个HTMLCollection。

var images = document.getElementsByTagName("img");

这行代码会将一个HTMLCollection 对象保存在images 变量中。与NodeList 对象类似,可以使用方括号语法或item()方法来访问HTMLCollection 对象中的项。而这个对象中元素的数量则可以通过其length 属性取得,如下面的例子所示。

alert(images.length); //输出图像的数量
alert(images[0].src); //输出第一个图像元素的src 特性
aler t(images.item(0).src); //输出第一个图像元素的 src 特性

HTMLCollection 对象还有一个方法,叫做namedItem(),使用这个方法可以通过元素的name特性取得集合中的项。例如,假设上面提到的页面中包含如下<img>元素:

<img src="myimage.gif" name="myImage">

那么就可以通过如下方式从images 变量中取得这个<img>元素:

var myImage = images.namedItem("myImage");

在提供按索引访问项的基础上,HTMLCollection 还支持按名称访问项,这就为我们取得实际想要的元素提供了便利。而且,对命名的项也可以使用方括号语法来访问,如下所示:

var myImage = images["myImage"];

对HTMLCollection 而言,我们可以向方括号中传入数值或字符串形式的索引值。在后台,对数值索引就会调用item(),而对字符串索引就会调用namedItem()。
要想取得文档中的所有元素,可以向getElementsByTagName()中传入"*"。在JavaScript 及CSS中,星号(*)通常表示“全部”。下面看一个例子。

var allElements = document.getElementsByTagName("*");

仅此一行代码返回的HTMLCollection 中,就包含了整个页面中的所有元素——按照它们出现的先后顺序。换句话说,第一项是<html>元素,第二项是<head>元素,以此类推。由于IE 将注释(Comment)实现为元素(Element),因此在IE 中调用getElementsByTagName("*")将会返回所有注释节点。

虽然标准规定标签名需要区分大小写,但为了最大限度地与既有HTML 页面兼容,传给getElementsByTagName()的标签名是不需要区分大小写的。但对于XML页面而言(包括XHTML),getElementsByTagName()方法就会区分大小写。

第三个方法,也是只有HTMLDocument 类型才有的方法,是getElementsByName()。顾名思义,这个方法会返回带有给定name 特性的所有元素。最常使用getElementsByName()方法的情况是取得单选按钮;为了确保发送给浏览器的值正确无误,所有单选按钮必须具有相同的name 特性,如下面的例子所示。

<fieldset>
	<legend>
		Which color do you prefer?
	</legend>
	<ul>
		<li>
			<input type="radio" value="red" name="color" id="colorRed">
			<label for="colorRed">
				Red
			</label>
		</li>
		<li>
			<input type="radio" value="green" name="color" id="colorGreen">
			<label for="colorGreen">
				Green
			</label>
		</li>
		<li>
			<input type="radio" value="blue" name="color" id="colorBlue">
			<label for="colorBlue">
				Blue
			</label>
		</li>
	</ul>
</fieldset>

如这个例子所示,其中所有单选按钮的name 特性值都是"color",但它们的ID 可以不同。ID 的作用在于将<label>元素应用到每个单选按钮,而name 特性则用以确保三个值中只有一个被发送给浏览器。这样,我们就可以使用如下代码取得所有单选按钮:

var radios = document.getElementsByName("color");

与getElementsByTagName()类似,getElementsByName()方法也会返回一个HTMLCollectioin。但是,对于这里的单选按钮来说,namedItem()方法则只会取得第一项(因为每一项的name 特性都相同)。

4. 特殊集合

除了属性和方法,document 对象还有一些特殊的集合。这些集合都是HTMLCollection 对象,为访问文档常用的部分提供了快捷方式,包括:

  • document.anchors,包含文档中所有带name 特性的<a>元素;
  • document.applets,包含文档中所有的<applet>元素,因为不再推荐使用<applet>元素,所以这个集合已经不建议使用了;
  • document.forms,包含文档中所有的<form>元素,与document.getElementsByTagName("form")得到的结果相同;
  • document.images,包含文档中所有的<img>元素,与document.getElementsByTagName("img")得到的结果相同;
  • document.links,包含文档中所有带href 特性的<a>元素。

这个特殊集合始终都可以通过HTMLDocument 对象访问到,而且,与HTMLCollection 对象类似,集合中的项也会随着当前文档内容的更新而更新。

5. DOM 一致性检测

由于DOM 分为多个级别,也包含多个部分,因此检测浏览器实现了DOM的哪些部分就十分必要了。document.implementation 属性就是为此提供相应信息和功能的对象,与浏览器对DOM的实现直接对应。DOM1 级只为document.implementation 规定了一个方法,即hasFeature()。这个方法接受两个参数:要检测的DOM 功能的名称及版本号。如果浏览器支持给定名称和版本的功能,则该方法返回true,如下面的例子所示:

var hasXmlDom = document.implementation.hasFeature("XML", "1.0");

下表列出了可以检测的不同的值及版本号。

尽管使用hasFeature()确实方便,但也有缺点。因为实现者可以自行决定是否与DOM 规范的不同部分保持一致。事实上,要想让hasFearture()方法针对所有值都返回true 很容易,但返回true有时候也不意味着实现与规范一致。例如,Safari 2.x 及更早版本会在没有完全实现某些DOM 功能的情况下也返回true。为此,我们建议多数情况下,在使用DOM 的某些特殊的功能之前,最好除了检测hasFeature()之外,还同时使用能力检测。

6. 文档写入

有一个document 对象的功能已经存在很多年了,那就是将输出流写入到网页中的能力。这个能力体现在下列4 个方法中:write()、writeln()、open()和close()。其中,write()和writeln()方法都接受一个字符串参数,即要写入到输出流中的文本。write()会原样写入,而writeln()则会在字符串的末尾添加一个换行符(\n)。在页面被加载的过程中,可以使用这两个方法向页面中动态地加入内容,如下面的例子所示。

<html>
	<head>
		<title>
			document.write() Example
		</title>
	</head>
	<body>
		<p>
			The current date and time is:
			<script type="text/javascript">
				document.write("<strong>" + (new Date()).toString() + "</strong>");
			</script>
		</p>
	</body>
</html>

运行一下

这个例子展示了在页面加载过程中输出当前日期和时间的代码。其中,日期被包含在一个<strong>元素中,就像在HTML 页面中包含普通的文本一样。这样做会创建一个DOM 元素,而且可以在将来访问该元素。通过write()和writeln()输出的任何HTML 代码都将如此处理。

此外,还可以使用write()和writeln()方法动态地包含外部资源,例如JavaScript 文件等。在包含JavaScript 文件时,必须注意不能像下面的例子那样直接包含字符串"</script>",因为这会导致该字符串被解释为脚本块的结束,它后面的代码将无法执行。

<html>
	<head>
		<title>
			document.write() Example 2
		</title>
	</head>
	<body>
		<script type="text/javascript">
			document.write("<script type=\"text/javascript\" src=\"file.js\">" + "</script>");
		</script>
	</body>
</html>

运行一下

即使这个文件看起来没错,但字符串"</script>"将被解释为与外部的<script>标签匹配,结果文本");将会出现在页面中。为避免这个问题,只需加入转义字符\即可;

第2 章也曾经提及这个问题,解决方案如下。

<html>
	<head>
		<title>
			document.write() Example 3
		</title>
	</head>
	<body>
		<script type="text/javascript">
			document.write("<script type=\"text/javascript\" src=\"file.js\">" + "<\/script>");
		</script>
	</body>
</html>

运行一下
字符串"<\/script>"不会被当作外部<script>标签的关闭标签,因而页面中也就不会出现多余的内容了。

前面的例子使用document.write()在页面被呈现的过程中直接向其中输出了内容。如果在文档加载结束后再调用document.write(),那么输出的内容将会重写整个页面,如下面的例子所示:

<html>
	<head>
		<title>
			document.write() Example 4
		</title>
	</head>
	<body>
		<p>
			This is some content that you won't get to see because it will be overwritten.
		</p>
		<script type="text/javascript">
			window.onload = function() {
				document.write("Hello world!");
			};
		</script>
	</body>
</html>

运行一下

在这个例子中,我们使用了window.onload 事件处理程序(事件将在第13 章讨论),等到页面完全加载之后延迟执行函数。函数执行之后,字符串"Hello world!"会重写整个页面内容。

方法open()和close()分别用于打开和关闭网页的输出流。如果是在页面加载期间使用write()或writeln()方法,则不需要用到这两个方法。

严格型XHTML 文档不支持文档写入。对于那些按照application/xml+xhtml内容类型提供的页面,这两个方法也同样无效。

更多章节教程:http://www.shouce.ren/api/view/a/15218

posted @ 2017-05-06 09:22  热点周报  阅读(266)  评论(0编辑  收藏  举报
Top