XML与HTML的结合

１、XML的局限性
　　目前，许多Web网站的内容数据都存放在数据库或数据文件中。对于Web程序开发人员来说，如果要想把有用的信息从数据库中提取出来，传统的方法是在服务器端编写脚本程序（如VBScript、JavaScript、CGI、ASP、Perl等等），通过对数据库执行SQL查询得到相关记录，然后把查询结果组织成HTML页面返回给客户端，用户使用浏览器观察最终结果。
　　为了提高系统服务的灵活性、可扩展性，使服务对象范围更广，许多商业网站都尽可能地把商务规则、原始数据和表现形式当做相互独立的服务分别提供。HTML那种蕴数据于显示之中的方式显然不合乎这种需求。因此，把原始数据存放在XML文档中，使用样式单文件显示内容是XML技术适合于电子商务的优势所在。但从本质上来说，XSL技术不是面向数据显示的，它是一种格式转换技术，在显示手段和方式上都远不及HTML那样丰富。对编程人员来说，一种较为理想的方案是把HTML和XML两种技术相结合，优势互补，使真正的原始数据在能够保持本来意义和结构的同时，还能充分利用HTML那千变万化的显示技巧。XML数据岛就是这种技术融合的产物，它使用<XML>标签把XML数据直接嵌入到HTML页面中，从而实现了二者的优势互补。
２、IE中数据岛的处理方式
　　为了能够处理这种内嵌XML代码的HTML页面，Internet Explorer 4.0（以下简称IE 4.0）引入了DSO（Data Source Objects，数据源对象）技术，用Java Applet实现。
　　例如：
　　<APPLET CODE=“com.ms.xml.dso.XMLDSO.class” ID=“xmldso” WIDTH=0 HEIGHT=0 MAYSCRIPT=TRUE>
　　<PARAM NAME=“URL” VALUE=“myXML.xml”>
　　</APPLET>
　　上述例子中，CODE属性指明了DSO Java小程序，MAYSCRIPT属性保证用户端脚本能够处理数据对象，PARAM标签指明了XML文档的位置。
　　使用Java的局限性在于只能在HTML文档中说明XML的URL地址，而不能直接将XML标签嵌入其中，这就和真正的数据岛方案还有一定的差距。微软在Internet Explorer 5.0（以下简称IE 5.0）中对DSO技术进行了扩展，突破了以往的限制，使HTML和XML真正地融合到了一起。HTML页面中支持直接使用<XML>标签。
　　例如：
　　<HTML>
　　<XML ID=“xmldso”>
　　<?xml version=“1.0”?>
　　some XML……
　　</XML>
　　只要保证每个数据岛的ID都是唯一的，就可以在页面中的任何必要的地方嵌入数据岛，并且这些DSO彼此都是相互独立的。
　　除了上面例子中的这种直接嵌入方式，还可以使用外部引用方式链接数据岛。
　　例如：
　　<XML ID=“xmldso” SRC=“myXML.xml”>
　　</XML>
　　这样，只有当公司的客户对象继续使用IE 4.0，并且为了解决这部分客户的兼容性问题时，Java Applet才是编程人员要考虑的选择方案。
　　在IE 5.0所实现的DSO技术中，如果数据是通过SQL语言对数据库进行查询得到的结果，那么就把它们存放在ADO（ActiveX Data Objects）记录集中。服务器把这种ActiveX控件（通常是ADO记录集）发送到客户端，由客户端脚本程序做进一步的处理。实际上，IE 5.0就是把XML数据岛作为一种特殊的ADO记录集进行处理的。
３、XML的数据绑定
（1）ADO记录集的映射
　　XML中的每一条主元素都被映射为ADO记录集中的一条记录，而子元素则相应地被映射到记录集中的字段（也称为域）。
　　例如，存在XML数据岛books.xml如下：
　　<XML ID=“xmldso”>
　　<?xml version=“1.0”?>
　　<booklist>
　　<book>
　　<title>Straight Talk About Computers</title>
　　<isbn>72-80088-005</isbn>
　　</book>
　　<book>
　　<title> Gourmet Microwave </title>
　　<isbn>72-80081-082</isbn>
　　</book>
　　</booklist>
　　</XML>
　　此时，映射后的ADO记录集为：

（2）与HTML元素的绑定
　　在HTML文档中嵌入数据岛之后，就可以将XML数据岛与HTML元素绑定在一起。每一个DSO条目（即数据岛）都有唯一的ID号。首先将HTML元素中的DATASRC属性设置为相应的ID，就可以把HTML元素和数据岛联系在一起。然后再通过设置DATAFLD属性值，来确定所提取的XML元素。
　　例如，与DIV元素绑定的代码如下：
　　<DIV ID=title DATASRC=#xmldso DATAFLD=“title”></DIV>
　　<DIV ID=price DATASRC=#xmldso DATAFLD=“isbn”></DIV>
　　注意：并非所有的HTML元素都能与XML数据岛绑定。目前，支持这种DSO绑定机制的元素如下：
　　A、APPLET、BUTTON、DIV、FRAME、IFRAME、 IMG、INPUT (此处类型是：CHECKBOX、HIDDEN、 LABEL、PASSWORD、RADIO和TEXT)、LABEL、 MARQUEE、SELECT、SPAN、TABLE和 TEXTAREA。
（3）以表格方式显式XML数据
　　若把XML数据与TABLE元素绑定在一起，就可以自动地显示为多行的表格形式。
　　例如，XML数据与TABLE元素绑定的代码如下：
　　<TABLE BORDER=1 DATASRC=“#xmldso”>
　　<THEAD>
　　<TR><TH>Title</TH>
　　<TH>ISBN</TH></TR>
　　</THEAD>
　　<TBODY>
　　<TR><TD><DIV DATAFLD=“title”></DIV></TD>
　　<TD><DIV DATAFLD=“isbn”>
　　</DIV></TD></TR>
　　</TBODY>
　　</TABLE>
　　这样，通过将TABLE元素中的DATASRC属性设定为#xmldso，把两者绑定起来。表格内部分为表头（THEAD）和表体（TBODY）两部分。每一个<book>元素都会显示为一行表格，具体每一栏显示哪一项数据，则由DIV元素中的DATAFLD属性指定。
４、XML的嵌套处理
　　一般情况下，我们从数据库中查询得到的结果集可能很大，所以从服务器返回到客户端时，数据会被分成若干个页面分别进行传递。此时，利用TABLE元素中的DATAPAGESIZE属性可以指定每个页面包含记录集条目的个数。
　　例如：
　　<TABLE DATASRC=“#xmldso” DATAPAGESIZE=10>
　　很显然，如果XML数据格式是对称的，则无论是映射到ADO记录集还是绑定到表格元素上，效果都会很好。而在实际应用中，XML数据为非对称的例子也很多，比如一本书的作者可能就不止一位，这在映射和绑定时都会产生一定的麻烦。解决问题的办法就是利用嵌套。每一行表格仍对应一条主元素，每一栏也对应着一个子元素。对于重复元素，则使用嵌套的表格。我们假设在books.xml中，第一本书的作者为Dean Straight，第二本书的作者为Charlotte Cooper、Shelley Burke和Regina Murphy。此时，绑定过程如下：
　　● 创建TABLE元素，并将数据岛ID赋值给DATAFLD属性；
　　● 对于单独的XML元素，如<isbn>，创建TD元素，并设定相应的DATAFLD属性；
　　● 对于重复元素，在TD元素内部嵌套一个表格；
　　● 用单行单列的形式显示作者信息。
　　注意这里的DATAFLD属性必须设定为“$TEXT”，以保证嵌套元素的内容被全部显示在指定的元素中。
　　完整的HTML代码如下所示：
　　<TABLE BORDER=1 DATASRC=“#xmldso”>
　　<THEAD><TR><TH>Title</TH>
　　<TH>ISBN</TH>
　　<TH>Author</TH></TR></THEAD>
　　<TBODY>
　　<TR><TD>
　　<DIV DATAFLD=“title”></DIV></TD>
　　<TD><DIV DATAFLD=“isbn”>
　　</DIV></TD>
　　<TD>
　　<TABLE BORDER=0 DATASRC=“#xmldso” DATAFLD=“author”>
　　<TR><TD><SPAN DATAFLD=“$Text”></SPAN></TD></TR>
　　</TABLE>
　　</TD>
　　</TR></TBODY>
　　</TABLE>
　　事实上，使用DSO效果最好的情况是针对结构对称的数据，而处理非对称数据更有效的办法是使用我们以后将要介绍的DOM技术。
５、DSO技术的应用
（1）访问元素的属性
　　用DSO访问元素的属性很简单，可以直接把属性按子元素来处理。
　　例如：
　　<book isbn=“9-001-122-12”>
　　……
　　</book>
　　这样，在绑定到HTML表格中时，就可以直接按子元素来处理：
　　<TD><SPAN DATAFLD=“isbn”> </SPAN></TD>
　　如果遇到属性名和子元素名一样的情况，在元素名前加上“!”进行区分。
（2）遍历记录集
　　DSO把XML数据岛当做ADO记录集进行处理的一大好处是可以利用ADO提供的各种方法对数据源进行访问，尤其是当把数据岛与类似SPAN、DIV和INPUT等HTML元素绑定时。通常这些元素显示的是记录集的首条记录，要想对记录集进行遍历浏览，可以使用ADO的方法 : Move、MoveFirst、MoveLast、MoveNext和MovePrevious。比如创建一个按钮响应函数，只要用户点击“Next”按钮，就可以逐条浏览相应的记录。
　　例如：
　　<XML ID=“xmldso” SRC=“books.xml”>
　　</XML>
　　Sub btnNext_onclick()
　　xmldso.RecordSet.MoveNext
　　End Sub
（3）与Script语言相结合
　　有些用户比较习惯编写Script语言，利用DSO技术同样可以与各种Script很好地结合在一起。
　　例如（以VB Script为例），访问记录集时，代码如下:
　　Dim rsBooks
　　Set rsBooks = xmldso.RecordSet
　　访问字段（子元素）的值：
　　Dim sTitle
　　sTitle = rsBooks(“title”)
　　可以使用innerText和innerHTML属性把得到的值传递给HTML元素。例如，有一个DIV元素名为divTitle，赋值代码如下所示：
　　divTitle.innerTEXT = sTitle
　　利用脚本程序还可以处理许多DSO事件，下表列举了其中的一部分事件：

　　在脚本中处理各种事件的方法就是在<SCRIPT>标签中使用FOR属性指定XML数据岛ID，使用EVENT属性确定事件类型。
　　例如，获取记录集中条目的个数：
　　<SCRIPT Language=“VB Script” FOR=“xmldso” EVENT=“onDataAvailable”>
　　lblRecords.value = booklist.RecordSet.RecordCount
　　</SCRIPT>
　　除了显示记录数据之外，脚本程序还可以对记录集进行快速查询、排序、编辑等操作。但要指出的是，虽然ADO技术中提供了类似SortColumn和SortAscending等方法对XML数据进行排序，但是效果不如XSL中的排序操作，所以建议大家充分利用XSL技术来实现这部分功能。
　　其余的功能，如利用脚本对记录集进行诸如增加、删除、修改等操作，或是分页显示HTML表格等等，在这里就不一一举例说明了，用法与前面的操作大同小异。最后需要说明的是，所有对DSO对象的操作都是在用户端完成的，实际上是服务器数据对象的一份复制品，这样做的好处是避免了网络承受大量数据通信的负担。但这时用户端所做的任何操作对服务器上存储的数据毫无影响，如果要想对服务器记录也进行修改，那么就要用到客户端与服务器端的数据交换技术，我们将在以后对此进行介绍。

posted on 2007-04-02 18:38 念时阅读(912) 评论(0) 编辑收藏举报