JavaScript(第二十九天)【js处理XML】

随着互联网的发展，Web应用程序的丰富，开发人员越来越希望能够使用客户端来操作XML技术。而XML技术一度成为存储和传输结构化数据的标准。所以，本章就详细探讨一下JavaScript中使用XML的技术。

对于什么是XML，干什么用的，这里就不在赘述了，在以往的XHTML或PHP课程都有涉及到，可以理解成一个微型的结构化的数据库，保存一些小型数据用的。

一．IE中的XML

在统一的正式规范出来以前，浏览器对于XML的解决方案各不相同。DOM2级提出了动态创建XML DOM规范，DOM3进一步增强了XML DOM。所以，在不同的浏览器实现XML的处理是一件比较麻烦的事情。

1.创建XMLDOM对象

IE浏览器是第一个原生支持XML的浏览器，而它是通过ActiveX对象实现的。这个对象，只有IE有，一般是IE9之前采用。微软当年为了开发人员方便的处理XML，创建了MSXML库，但却没有让Web开发人员通过浏览器访问相同的对象。

var xmlDom = new ActiveXObject('MSXML2.DOMDocument');

ActiveXObject类型

XML版本字符串	说明
Microsoft.XmlDom	最初随同IE发布，不建议使用
MSXML2.DOMDocument	脚本处理而更新的版本，仅在特殊情况作为备份用
MSXML2.DOMDocument.3.0	在JavaScript中使用，这是最低的建议版本
MSXML2.DOMDocument.4.0	脚本处理时并不可靠，使用这个版本导致安全警告
MSXML2.DOMDocument.5.0	脚本处理时并不可靠，使用这个版本导致安全警告
MSXML2.DOMDocument.6.0	脚本能够可靠处理的最新版本

PS：在这六个版本中微软只推荐三种：

1.MSXML2.DOMDocument.6.0 最可靠最新的版本

2.MSXML2.DOMDocument.3.0 兼容性较好的版本

3.MSXML2.DOMDocument 仅针对IE5.5之前的版本

PS：这三个版本在不同的windows平台和浏览器下会有不同的支持，那么为了实现兼容，我们应该考虑这样操作：从6.0->3.0->备用版本这条路线进行实现。

function createXMLDOM() {

var version = [

'MSXML2.DOMDocument.6.0',

'MSXML2.DOMDocument.3.0',

'MSXML2.DOMDocument'

];

for (var i = 0; i < version.length; i ++) {

try {

var xmlDom = new ActiveXObject(version[i]);

return xmlDom;

} catch (e) {

//跳过

}

throw new Error('您的系统或浏览器不支持MSXML！'); //循环后抛出错误

}

2.载入XML

如果已经获取了XMLDOM对象，那么可以使用loadXML()和load()这两个方法可以分别载入XML字符串或XML文件。

xmlDom.loadXML('<root version="1.0"><user>Dkf</user></root>');

alert(xmlDom.xml);

PS：loadXML参数直接就是XML字符串，如果想效果更好，可以添加换行符\n。.xml属性可以序列化XML，获取整个XML字符串。

xmlDom.load('test.xml'); //载入一个XML文件

alert(xmlDom.xml);

当你已经可以加载了XML，那么你就可以用之前学习的DOM来获取XML数据，比如标签内的某个文本。

var user = xmlDom.getElementsByTagName('user')[0]; //获取<user>节点

alert(user.tagName); //获取<user>元素标签

alert(user.firstChild.nodeValue); //获取<user>里的值Dkf

DOM不单单可以获取XML节点，也可以创建。

var email= xmlDom.createElement('email');

xmlDom.documentElement.appendChild(email);

3.同步及异步

load()方法是用于服务器端载入XML的，并且限制在同一台服务器上的XML文件。那么在载入的时候有两种模式：同步和异步。

所谓同步：就是在加载XML完成之前，代码不会继续执行，直到完全加载了XML再返回。好处就是简单方便、坏处就是如果加载的数据停止响应或延迟太久，浏览器会一直堵塞从而造成假死状态。

xmlDom.async = false; //设置同步，false，可以用PHP测试假死

所谓异步：就是在加载XML时，JavaScript会把任务丢给浏览器内部后台去处理，不会造成堵塞，但要配合readystatechange事件使用，所以，通常我们都使用异步方式。

xmlDom.async = true; //设置异步，默认

通过异步加载，我们发现获取不到XML的信息。原因是，它并没有完全加载XML就返回了，也就是说，在浏览器内部加载一点，返回一点，加载一点，返回一点。这个时候，我们需要判断是否完全加载，并且可以使用了，再进行获取输出。

XML DOM中readystatechange事件

就绪状态	说明
1	DOM正在加载
2	DOM已经加载完数据
3	DOM已经可以使用，但某些部分还无法访问
4	DOM已经完全可以
PS：readyState可以获取就绪状态值

var xmlDom = createXMLDOM();

xmlDom.async = true; //异步，可以不写

xmlDom.onreadystatechange = function () {

if (xmlDom.readyState == 4) { //完全加载了，再去获取XML

alert(xmlDom.xml);

}

xmlDom.load('test.xml'); //放在后面重点体现异步的作用

PS：可以通过readyState来了解事件的执行次数，将load()方法放到最后不会因为代码的顺序而导致没有加载。并且load()方法必须放在onreadystatechange之后，才能保证就绪状态变化时调用该事件处理程序，因为要先触发。用PHP来测试，在浏览器内部执行时，是否能操作，是否会假死。

PS：不能够使用this，不能够用IE的事件处理函数，原因是ActiveX控件为了预防安全性问题。

PS：虽然可以通过XML DOM文档加载XML文件，但公认的还是XMLHttpRequest对象比较好。这方面内容，我们在Ajax章节详细了解。

4.解析错误

在加载XML时，无论使用loadXML()或load()方法，都有可能遇到XML格式不正确的情况。为了解决这个问题，微软的XML DOM提供了parseError属性。

parseError属性对象

属性	说明
errorCode	发生的错误类型的数字代号
filepos	发生错误文件中的位置
line	错误行号
linepos	遇到错误行号那一行上的字符的位置
reason	错误的解释信息

if (xmlDom.parseError == 0) {

alert(xmlDom.xml);

} else {

throw new Error('错误行号：' + xmlDom.parseError.line +

'\n错误代号：' + xmlDom.parseError.errorCode +

'\n错误解释：' + xmlDom.parseError.reason);

}

二．DOM2中的XML

IE可以实现了对XML字符串或XML文件的读取，其他浏览器也各自实现了对XML处理功能。DOM2级在document.implementaion中引入了createDocument()方法。IE9、Firefox、Opera、Chrome和Safari都支持这个方法。

1.创建XMLDOM对象

var xmlDom = document.implementation.createDocument('','root',null); //创建xmlDom

var user = xmlDom.createElement('user'); //创建user元素

xmlDom.getElementsByTagName('root')[0].appendChild(user); //添加到root下

var value = xmlDom.createTextNode('Dkf'); //创建文本

xmlDom.getElementsByTagName('user')[0].appendChild(value); //添加到user下

alert(xmlDom.getElementsByTagName('root')[0].tagName);

alert(xmlDom.getElementsByTagName('user')[0].tagName);

alert(xmlDom.getElementsByTagName('user')[0].firstChild.nodeValue);

PS：由于DOM2中不支持loadXML()方法，所以，无法简易的直接创建XML字符串。所以，只能采用以上的做法。

PS：createDocument()方法需要传递三个参数，命名空间，根标签名和文档声明，由于JavaScript管理命名空间比较困难，所以留空即可。文档声明一般根本用不到，直接null即可。命名空间和文档声明留空，表示创建XMLDOM对象不需要命名空间和文档声明。

PS：命名空间的用途是防止太多的重名而进行的分类，文档类型表明此文档符合哪种规范，而这里创建XMLDOM不需要使用这两个参数，所以留空即可。

2.载入XML

DOM2只支持load()方法，载入一个同一台服务器的外部XML文件。当然，DOM2也有async属性，来表面同步或异步，默认异步。

//同步情况下

var xmlDom = document.implementation.createDocument('','root',null);

xmlDom.async = false;

xmlDom.load('test.xml');

alert(xmlDom.getElementsByTagName('user')[0].tagName);

//异步情况下

var xmlDom = document.implementation.createDocument('','root',null);

xmlDom.async = true;

addEvent(xmlDom, 'load', function () { //异步直接用onload即可

alert(this.getElementsByTagName('user')[0].tagName);

});

xmlDom.load('test.xml');

PS：不管在同步或异步来获取load()方法只有Mozilla的Firefox才能支持，只不过新版的Opera也是支持的，其他浏览器则不支持。

3.DOMParser类型

由于DOM2没有loadXML()方法直接解析XML字符串，所以提供了DOMParser类型来创建XML DOM对象。IE9、Safari、Chrome和Opera都支持这个类型。

var xmlParser = new DOMParser(); //创建DOMParser对象

var xmlStr = '<user>Dkf</user></root>'; //XML字符串

var xmlDom = xmlParser.parseFromString(xmlStr, 'text/xml'); //创建XML DOM对象

alert(xmlDom.getElementsByTagName('user')[0].tagName); //获取user元素标签名

PS：XML DOM对象是通过DOMParser对象中的parseFromString方法来创建的，两个参数：XML字符串和内容类型text/xml。

4.XMLSerializer类型

由于DOM2没有序列化XML的属性，所以提供了XMLSerializer类型来帮助序列化XML字符串。IE9、Safari、Chrome和Opera都支持这个类型。

var serializer = new XMLSerializer(); //创建XMLSerializer对象

var xml = serializer.serializeToString(xmlDom); //序列化XML

alert(xml);

5.解析错误

在DOM2级处理XML发生错误时，并没有提供特有的对象来捕获错误，而是直接生成另一个错误的XML文档，通过这个文档可以获取错误信息。

var errors = xmlDom.getElementsByTagName('parsererror');

if (errors.length > 0) {

throw new Error('XML格式有误：' + errors[0].textContent);

}

PS：errors[0].firstChild.nodeValue也可以使用errors[0].textContent来代替。

三．跨浏览器处理XML

如果要实现跨浏览器就要思考几个个问题：1.load()只有IE、Firefox、Opera支持，所以无法跨浏览器；2.获取XML DOM对象顺序问题，先判断先进的DOM2的，然后再去判断落后的IE；3.针对不同的IE和DOM2级要使用不同的序列化。4.针对不同的报错进行不同的报错机制。

//首先，我们需要跨浏览器获取XML DOM

function getXMLDOM(xmlStr) {

var xmlDom = null;

if (typeof window.DOMParser != 'undefined') { //W3C

xmlDom = (new DOMParser()).parseFromString(xmlStr, 'text/xml');

var errors = xmlDom.getElementsByTagName('parsererror');

if (errors.length > 0) {

throw new Error('XML解析错误：' + errors[0].firstChild.nodeValue);

}

} else if (typeof window.ActiveXObject != 'undefined') { //IE

var version = [

'MSXML2.DOMDocument.6.0',

'MSXML2.DOMDocument.3.0',

'MSXML2.DOMDocument'

];

for (var i = 0; i < version.length; i ++) {

try {

xmlDom = new ActiveXObject(version[i]);

} catch (e) {

//跳过

}

xmlDom.loadXML(xmlStr);

if (xmlDom.parseError != 0) {

throw new Error('XML解析错误：' + xmlDom.parseError.reason);

}

} else {

throw new Error('您所使用的系统或浏览器不支持XML DOM！');

}

return xmlDom;

}

//其次，我们还必须跨浏览器序列化XML

function serializeXML(xmlDom) {

var xml = '';

if (typeof XMLSerializer != 'undefined') {

xml = (new XMLSerializer()).serializeToString(xmlDom);

} else if (typeof xmlDom.xml != 'undefined') {

xml = xmlDom.xml;

} else {

throw new Error('无法解析XML！');

}

return xml;

}

PS：由于兼容性序列化过程有一定的差异，可能返回的结果字符串可能会有一些不同。至于load()加载XML文件则因为只有部分浏览器支持而无法跨浏览器。

posted @ 2018-01-23 15:13 puppeteers 阅读(603) 评论(0) 编辑收藏举报

刷新页面返回顶部

puppeteers

JavaScript(第二十九天)【js处理XML】

公告