XSLT轻松入门
1.XSLT的概念
1.1 什么是XSLT
1.2 为什么要用XSLT
1.3 XSLT的历史
1.4 什么是XPath
1.5 XSLT和CSS的比较
1.6 XSLT和IE5
1.XSLT的概念
我们首先来澄清一个概念,大家可能听说过XSL(eXtensible Stylesheet Language),XSL和我们这里说的XSLT从狭义上理解是一样的,而按照W3C的标准,XSLT的说法更严格些,因此我们在文章中统一使用XSLT的称法。它们之间具体的关系我们会在下面讲述。
1.1 什么是XSLT
XSLT的英文标准名称为eXtensible Stylesheet Language Transformation。根据W3C的规范说明书(http://www.w3.org/TR/xslt),最早设计XSLT的用意是帮助XML文档(document)转换为其它文档。但是随着发展,XSLT已不仅仅用于将XML转换为HTML或其它文本格式,更全面的定义应该是:
XSLT是一种用来转换XML文档结构的语言。
1.2 为什么要用XSLT
我们已经知道,XML是一种电脑程序间交换原始数据的简单而标准的方法。它的成功并不在于它容易被人们书写和阅读,更重要的是,它从根本上解决了应用系统间的信息交换。因为XML满足了两个基本的需求:
(1).将数据和表达形式分离。就象天气预报的信息可以显示在不同的设备上,电视,手机或者其它。
(2).在不同的应用之间传输数据。电子商务数据交换的与日俱增使得这种需求越来越紧迫。
为了使数据便于人们的阅读理解,我们需要将信息显示出来或者打印出来,例如将数据变成一个HTML文件,一个PDF文件,甚至是一段声音;同样,为了使数据适合不同的应用程序,我们必须有能够将一种数据格式转换为另一种数据格式,比如需求格式可能是一个文本文件,一个SQL语句,一个HTTP信息,一定顺序的数据调用等。而XSLT就是我们用来实现这种转换功能的语言。将XML转换为HTML,是目前XSLT最主要的功能。
1.3 XSLT的历史
想很多其他XML家族成员一样,XSLT是由W3C起草和制定的。它的主要发展历程如下:
.1995年由James Clark提议;
.1997年8月正式提案为XSL;
.1998年5月由Norman Walsh完成需求概要;
.1998年8月18日XSL草案发布;
.1999年11月16日正式发布XSL 1.0推荐版本。
目前,XSLT仍然在快速的发展中,XSLT1.1的草案已经可以在W3C网站(http://www.w3.org/TR/xslt11)上看到。
1.4 什么是XPath
XPath是XSLT的重要组成部分,我们将在第四章讲解它的详细语法。那么XPath是什么呢?我们首先来了解一下XSL系列的"家族"关系。如下图:
XSL在转换XML文档时分为明显的两个过程,第一转换文档结构;其次将文档格式化输出。这两步可以分离开来并单独处理,因此XSL在发展过程中逐渐分裂为XSLT(结构转换)和XSL-FO(formatting objects)(格式化输出)两种分支语言,其中XSL-FO的作用就类似CSS在HTML中的作用。而我们这里重点讨论的是第一步的转换过程,也就是XSLT。
另外,在学习XML时我们已经知道XML是一个完整的树结构文档。在转换XML文档时可能需要处理其中的一部分(节点)数据,那么如何查找和定位XML文档中的信息呢,XPath就是一种专门用来在XML文档中查找信息的语言。XPath隶属XSLT,因此我们通常会将XSLT语法和XPath语法混在一起说。
用一种比较好理解的解释:如果将XML文档看作一个数据库,XPath就是SQL查询语言;如果将XML文档看成DOS目录结构,XPath就是cd,dir等目录操作命令的集合。
1.5 XSLT和CSS的比较
CSS同样可以格式化XML文档,那么有了CSS为什么还需要XSLT呢?因为CSS虽然能够很好的控制输出的样式,比如色彩,字体,大小等,但是它有严重的局限性,就是:
(1) CSS不能重新排序文档中的元素;
(2) CSS不能判断和控制哪个元素被显示,哪个不被显示;
(3) CSS不能统计计算元素中的数据;
换句话说,CSS只适合用于输出比较固定的最终文档。CSS的优点是简洁,消耗系统资源少;而XSLT虽然功能强大,但因为要重新索引XML结构树,所以消耗内存比较多。
因此,我们常常将它们结合起来使用,比如在服务器端用XSLT处理文档,在客户端用CSS来控制显示。可以减少响应时间。
1.6 XSLT和IE5
在XSLT草案发布不久,微软就在IE4中提供了支持XSL功能的预览版本,到IE5.0发布时,正式全面支持XSLT,可是由于IE5发布的比XSLT1.0标准时间早,因此在IE5.0中支持的XSTL功能和XSLT 1.0略有不同。(呵呵~~XML推行的主要原因之一就是解决HTML过分依赖浏览器的问题,现在微软又想标新立异?)。好在微软的IE5.5中执行的标准已经和W3C的XSLT1.0基本相近。但令人头疼的是IE5.0已经发行了几百万套,您使用的XSLT很可能不能被客户的浏览器正确执行。目前XSLT 1.1仍在发展中,W3C及有关组织也在和微软协商争取获得统一。呵呵~~故事还远远没有结束噢。
注意:本文中提到的语法都是根据XSLT 1.0的标准来讲的,没有任何微软的"方言"。
2. XSLT的实例
2.1 XSLT如何转换XML
2.2 一个实例
2.3 过程解析
2.4 XSLT的用途
2.1 XSLT如何转换XML
我们打个有趣的比方,你玩过橡皮泥吧,用不同的模子按上去,就可以做出需要的形状。如果我们假设XML数据文档是一块大橡皮泥,XSLT就象是一个模子,用力一按,就做出需要的形状来---符合不同需要的HTML文档。
具体看下面的过程示意图:
我们将XML原文档输入,用XSL作为模板,通过转换引擎,最终输出需要的HTML文档。其中的转换引擎就是比喻中"用力一按"的过程。在具体应用中,有专门的软件来实现这个转换过程,名为XML Processor。目前已经有很多 Processor 软件(下面将详细提到),在IE5.5中也已经内嵌了XML Processor。
2.2 一个实例
现在我们来看一个简单的XSLT实际应用例子,获得一些感官上的认识。很多网页设计师看到类似HTML的代码才会放心,代码是那样的亲切和熟悉。
例子1: "Hello, world!"
hello world作为第一个教程已经是程序语言中的惯例了。我们也遵守这个惯例,看看如何利用XSLT来显示"hello world"。虽然这个例子没有什么实际用途,但是请大家不要急,后面还有更详细的例子。
第一步:建立要输入XML文档hello.xml。
<greeting>Hello, world!</greeting>
这是一个很简单XML文档,只包含一个节点的XML结构树。
第二步:建立XSLT文档hello.xsl。提示:默认的XSLT文件的后缀名为.xsl。
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<xsl:template match="/">
<html>
<head>
<title>First XSLT example</title>
</head>
<body>
<p><xsl:value-of select="greeting"/></p>
</body>
</html>
</xsl:template>
</xsl:stylesheet>
你现在可以用IE5.0以上版本浏览器打开这个hello.xsl文件,看到XSL的结构树。
第三步:在XML中调用这个XSL文件。修改hello.xml的代码为:
<?xml-stylesheet type="text/xsl" href="hello.xsl"?>
<greeting>Hello, world!</greeting>
ok,到这一步原理上已经完成了所有的代码,接下来只要用一个XSLT的处理器(XML Processor)来执行hello.xml就可以看到"hello
world"的显示结果了。流行的处理器软件有以下几种:
(1).James Clark的XT。下载网址:http://www.jclark.com/xml/xt.html
(2).IBM的XML for Java软件包,名为LotusXSL。下载网址:www.alphaworks.ibm.com/tech/xml4j
(3).Saxon。下载网址:http://www.wrox.com
(4).微软的MSXML3。下载网址:http://www.microsoft.com/xml
有网友要问,我想在浏览器中看到"hello world"的效果应该怎么做?在微软的IE5.5内嵌了MSXML3解释器,你可以用IE5.5打开hello.xml文件,就可以看到结果。如果只看到XML结构树,不是单独的"hello
world"字样,说明你的浏览器没有安装MSXML3版本。
如果没有安装又想看效果怎么办?那还是用我们在XML教程中的老办法,采用JS实现。(这已经超出了本文要讲的范围,但为了更加直观,便于理解,我们在这里提供实例代码。)下面是一种实现的代码,可以保存为hello.htm,和上面的hello.xml,hello.xsl放在同一目录下面。最后用IE5.0以上版本打开hello.htm就可以看到效果了。
<head>
<script language="javascript" for="window" event="onload">
var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");
xmlDoc.async="false";
xmlDoc.load("hello.xml");
nodes = xmlDoc.documentElement.childNodes;
greeting.innerText = nodes.item(0).text;
</script>
<title>First XSLT Example</title>
</head>
<body bgcolor="#FFFFFF">
<span id="greeting"></span><br>
</body>
</html>
2.3 过程解析
如果你成功的看到效果,你也许想知道这些代码的具体含义,我们来详细解说:看hello.xsl文件
<?xml version="1.0" encoding="iso-8859-1"?>
这是标准的XML文档的首行代码,因为XSLT本身也是XML文档。encoding属性用来定义文档使用的编码形式,iso-8859-1主要支持西欧和北美的语言编码。如果你想使用简体中文,那么就应该写成:
<?xml version="1.0" encoding="GB2312"?>
接下去的代码是:
<xsl:stylesheet
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
这是标准的XSLT文件首行代码。xsl:stylesheet代码的意思是将文档作为一个样式表来(stylesheet)处理。xmlns:xsl属性是一个名字空间声明,和XML中的名字空间使用方法一样,用来防止元素名称重复和混乱。其中前缀xsl的意思是文档中使用的元素遵守W3C的XSLT规范。最后的version属性说明样式表只采用XSLT
1.0的标准功能,这也是目前仅有的标准。
<xsl:template match="/">
一个<xsl:template>元素定义一个模板规则。属性match="/"说明XML源文档中,这个模板规则作用的起点。"/"是一种XPath语法,我们在后面将详细讲述,这里的"/"代表XML结构树的根(root)。
接下去的代码是:
<head>
<title>First XSLT Example</title>
</head>
<body>
<p><xsl:value-of select="greeting"/></p>
</body>
</html>
说明:当模板规则被触发,模板的内容就会控制输出的结果。例子中,模板大部分内容由HTML元素和文本构成。只有<xsl:value-of>元素是XSLT语法,这里<xsl:value-of>的作用是拷贝原文档中的一个节点的值到输出文档。而select属性则详细指定要处理的节点名称。这是XPath语法,"greeting"的意思就是寻找根节点名为greeting的元素,并用模板来处理这个节点。具体的就是找到<greeting>元素,然后将元素的值"hello
world"按模板样式拷贝到输出文件。
提示:由于XML文档是严格的层级结构(用IE5查看XML文件,会看见XML文档类似多级关联菜单),所以我们形象的称XML文档为文档树,其中每一对元素称作树的一个节点。根元素就是根节点。
最后关闭所有元素:
</xsl:template>
</xsl:stylesheet>
好,例子解说完毕。你是否想过为什么要用这么复杂的方法来显示"hello world"呢?
关键不在表面,而在于实质:用这种方法,hello world可以从XML文档中被提取出来,并用各种不同的XSLT模板处理,来输出不同需求的文档。我们来看看XSLT的主要用途:
2.4 XSLT的用途
XSLT的主要用途就是数据转换应用。
由于以XML为基础的电子商务广泛普及,XSLT作为数据转换的角色也越来越重要。例如直接将电视新闻的数据格式转换成报纸新闻需要的数据格式;将股票数据直接转换成图片显示在网页上;对EDI(电子数据交换)数据进行统计,排序等等。
XSLT是处理类似工作的理想工具。
通过前面两章的介绍,我们已经对XSLT的基本概念和它的转换过程有了一些了解。下面我们一起来学习XSLT的具体语法。说到语法总是比较枯燥的,您可以大体上浏览一遍,等您真正需要使用XSLT的时候,再仔细研究它们。
3.XSLT的元素语法
3.1 xsl:template和xsl:apply-templates
3.2 xsl:value-of
3.3 xsl:for-each
3.4 xsl:if
3.5 Xxsl:choose, when, otherwise
3.6 xsl:sort
3.1 xsl:template和xsl:apply-templates
模板(template)是XSLT中最重要的概念之一。XSLT文件就是由一个一个的模板组成,任何一个XSLT文件至少包含一个模板。模板的概念就象是搭积木;你如果是程序员,也可以将模板看作一个方法,一个类,或者一个模块。它们可以被拼装组合,也可以单独成块,不同的模板控制不同的输出格式。
模板(template)由两部分组成:匹配模式(match pattern)和执行。简单的讲模式定义XML源文档中哪一个节点将被模板处理,执行则定义输出的是什么格式。两部分对应的语法为xsl:template和xsl:apply-templates。
xsl:template的语法是:
<xsl:template
match = pattern
name = qname
priority = number
mode = qname>
<!-- 执行内容 -->
</xsl:template>
xsl:template的作用是定义一个新模板。属性中name,priority,和mode用来区别匹配同一节点的不同模板。它们不是常用的属性。match属性则控制模板的匹配模式(pattern),匹配模式是用来定位XML源文档中哪一个节点被模板处理。一个模板匹配一个节点。我们用一个例子来帮助理解:
假设我们要处理一个包含章节和段落文档。我们用para元素定义段落,用chapter元素定义章节。我们来看看match属性可能的值。下面的语句写法说明模板匹配所有的para元素
<xsl:template match="para">
</xsl:template>
下面的语句写法说明模板匹配所有的para元素和所有的chapter元素:
<xsl:template match="(chapter|para)">
</xsl:template>
下面的语句写法说明模板匹配所有的父节点为chapter元素的para元素:
<xsl:template match="chapter//para">
</xsl:template>
下面的语句写法说明模板匹配根节点:
<xsl:template match="/">
</xsl:template>
我们再来看apply-templates语法:
<xsl:apply-templates
select = node set-expression
mode = qname>
</xsl:apply-templates>
xsl:apply-templates用来执行那一个节点被模板具体处理。你可以将它理解为程序中调用子函数。select属性用来定义确切的节点名称。xsl:apply-templates总是包含在xsl:template元素中,象这样:
<xsl:template match="/">
<xsl:apply-templates select="para"/>
</xsl:template>
这段代码说明摸板匹配整个文档(根节点),具体执行时处理根节点下所有para元素。
<xsl:template match="para">
<p><xsl:apply-templates/></p>
</xsl:template>
而这一段代码则表示摸板匹配para节点,所有para下的子元素都将被处理。
3.2 xsl:value-of
XSL:value-of用来将源文档中元素的文本值写到输出文档中。例如:
有一个个人资料的XML文档:
<?xml version="1.0" encoding="iso-8859-1"?>
<PERSON>
<name>ajie</name>
<age>28</age>
</PERSON>
我如果想在输出文档中显示上面这个XML源文档中的name元素的值,可以这样写XSLT代码:
<xsl:template match="PERSON">
<xsl:value-of select="name"/>
</xsl:template>
执行后,你会看到"ajie"被单独显示出来。其中match="PERSON"定义摸板匹配PERSON节点,xsl:value-of
语法说明需要输出一个节点的值,而select="name"则定义需要被输出的元素为name。看这个过程是不是和数据库里查询一个人的名字很象?当然,xsl:value-of查询还有更多,更复杂的语法,因为是涉及寻找和定位的功能,我们会放在后面的XPath语法中在仔细讲解。
同样功能的还有xsl:copy-of,用法一样,就不重复解释了。
3.3 xsl:for-each
xsl:for-each语法允许你循环处理被选择的节点。例如:有一个含多个个人资料的XML文档:
<PEOPLE>
<PERSON>
<name>ajie</name>
<age>28</age>
</PERSON>
<PERSON>
<name>tom</name>
<age>24</age>
</PERSON>
<PERSON>
<name>miake</name>
<age>30</age>
</PERSON>
</PEOPLE>
我需要显示所有人的姓名,则可以将XSLT代码写成:
<xsl:template match="PEOPLE">
<xsl:for-each select="child::PERSON">
<xsl:value-of select="name"/>
</ xsl:for-each>
</xsl:template>
3.4 xsl:if
xsl:if类似普通程序语言的if条件语句,允许设定节点满足某个条件时,被模板处理。xsl:if的语法格式为:
<xsl:if test=布尔表达式>
template body
</xsl:if>
例如:
<xsl:if test="@name">
<p><xsl:value-of select="@name"/></p>
</xsl:if>
</xsl:template>
这段代码的意思是检测PEOPLE节点下所有的元素,如果发现有<name>元素,则将<name>元素的值输出。其中@符号是统配符,表示节点下所有的元素。
3.5 xsl:choose, xsl:when 和 xsl:otherwise
xsl:if语法没有else的属性。如果我们要进行多项选择,那么就要使用xsl:choose / xsl:when / xsl:otherwise系列流程控制语法了。具体的使用请看下面的XSL文件例子:
<xsl:choose>
<xsl:when test="@name = 'ajie'">
<B><xsl:value-of select="@name"/></B>
</xsl:when>
<xsl:when test="@name">
<I><xsl:value-of select="@name"/></I>
</xsl:when>
<xsl:otherwise>
No name available
</xsl:otherwise>
<xsl:choose>
</xsl:template>
说明:首先在PEOPLE节点下寻找<name>属性值为ajie的元素,如果找到,将ajie用粗体输出;如果没有发现值为ajie的<name>元素,则将所有的<name>元素的值都用斜体输出;如果没有发现任何<name>元素,则显示"No
name available"。
3.6 xsl:sort
在XSLT中可以对XML源文档的元素进行重新排序,排序的语法就是xsl:sort。举例:下面的代码就是将文档元素按name排序。
<xsl:apply-templates select="PERSON">
<xsl:sort select="@name"/>
</xsl:apply-templates>
</xsl:template>
以上是XSLT的元素的主要语法,还有很多其他的语法,例如:import, include, element, attribute, number, param等等语法,在这里就不一一解释。我们的目的是让您对XSLT的语法有基本的概念,理解XSLT作为一种转换语言的强大功能。
4.XPath的语法
我们在前面已经提到过,XPath是用来帮助XSLT在XML源文档中查找定位信息的语言。在实际使用过程中,XPath和XSLT总是混在一起使用,在上面一章的语法例子中我们已经有使用到XPath的语法,只是没有明确点出。但W3C将它们分成两个标准,所以我们也将它们拆成两章来讲解。
4.XPath的语法
4.1 当前位置
4.2 寻址操作
4.3 运算符
4.4 功能函数
4.1 当前位置
当我们使用XSLT处理XML源文档是,我们用Context来表示当前正在被模板处理的节点位置。比如xsl:template match="/"语句中表示Context在文档的根(root)节点。我不知道如何准确的翻译Context这个词,它类似于C语言里的指针,表示程序当前运行的位置。理解Context对于正确处理XSL模板非常重要,当您的XSL模板输出的文档和您想要的不一样,最先应该分析的就是Context在哪里。
Location Paths是用于设定你想要寻找的Context节点位置。就类似DOS的目录命令。我们看个例子
<xsl:for-each select="child::PEOPLE/descendant::PERSON">
其中child::PEOPLE/descendant::PERSON就是XPath语法,这个表达式就是一个Location Paths,代码说明要显示所有PEOPLE元素的子元素和所有PERSON元素的子元素。通常我们会采用更简单的写法:
<xsl:for-each select="PEOPLE//PERSON">
我们来解释path的两种表示方法:"/"和"//"。
"/"是表示当前文档的节点,类似DOS目录分割符。例如:/PEOPLE表示选择根节点下的PEOPLE元素;PEOPLE/PERSON表示选择PEOPLE元素下所有的PESON子元素。
"file://"则表示当前文档所有的节点。类似查看整个目录。例如://PEOPLE表示选择文档中所有的PEOPLE元素,无论它在什么层次;PEOPLE//PERSON表示在PEOPLE元素下所有的PERSON元素,无论它的层次多深。
4.2 寻址操作
Axis和Predicate是XPath语法中对Location Paths进行定位操作的语法,具体的用法列表如下
Axis语法表
--------------------------------------------------------
表达式 简写 说明
--------------------------------------------------------
self . 选择当前的节点.。
例子 :
<TD><xsl:value-of select="."/></TD>
代码表示在当前位置插入当前的节点包含的文本(text)值,
--------------------------------------------------------
parent .. 选择当前节点的父节点。
--------------------------------------------------------
attribute @ 选择一个元素的所有属性。
例子:
<TD><xsl:value-of select="@PERSONID"/></TD>
选择PERSON元素的所有属性.
--------------------------------------------------------
child 选择当前节点的所有子元素。
--------------------------------------------------------
ancestor 选择当前节点的所有父元素(包括父元素的父元素,类推)
--------------------------------------------------------
Axis帮助我们选择当前节点周围所有的节点,而Predicate则用来定位当前节点内部的元素。表示方法为方括号[]中加表达式:[ Expression ]。具体举例如下:
PERSON[position()=2]
这句代码表示寻找第二个"PERSON" 元素
PERSON[starts-with(name, "B")]
这句代码表示寻找所有名称以"B"开头的PERSON元素。
4.3 运算符
这一节介绍XPath的运算符(Expressions),列表如下:
--------------------------------------------------------
运算符 说明
--------------------------------------------------------
and, or 就是普通意义的and, or
--------------------------------------------------------
= 等于
--------------------------------------------------------
!= 不等于
--------------------------------------------------------
>, >= 大于,大于等于
--------------------------------------------------------
<, <= 小于,小于等于。注意:在XSL文件中,<符号要用< 表示
--------------------------------------------------------
+, -, *, div 加减乘除
--------------------------------------------------------
mod 取模
--------------------------------------------------------
| 两个节点一起计算
--------------------------------------------------------
4.4 功能函数(Functions)
在XPath里有很多功能函数可以帮助我们精确寻找需要的节点。
count()功能
作用:统计计数,返回符合条件的节点的个数。
举例:<p><xsl:value-of select="count(PERSON[name=tom])"/></p>
说明:代码的用途是显示PERSON元素中姓名属性值为tom有几个。
number()功能
作用:将属性的值中的文本转换为数值。
举例:<p>The number is: <xsl:value-of select="number(book/price)"/></p>
说明:代码的用途是显示书的价格。
substring() 功能
语法:substring(value, start, length)
作用:截取字符串。
举例:<p><xsl:value-of select="substring(name, 1, 3)"/></p>
说明:代码的用途是截取name元素的值,从第一个字母开始显示到第三个。
sum()功能
作用:求和。
举例:<p>Total Price = <xsl:value-of select="sum(//price)"/></p>
说明:代码的用途是计算所有价格的和。
上面这些功能只是XPath语法中的一部分,还有大量的功能函数没有介绍,而且目前XPath的语法仍然在不断发展中。通过这些函数我们可以实现更加复杂的查询和操作。
看到这里,我们的入门教程就快结束了。通过走马观花式的快速学习,希望大家对XSLT应该有了一点基本概念:XSLT是一种转换XML文档的语言,它包含两个过程:转换和格式化。XSLT的功能比CSS强大得多,它有类似数据查询的语法。如果您对XSLT感兴趣,那么以上的知识是远远不够的,需要查询更多的资料。阿捷在最后一章附录为大家提供了主要的XSLT资源。
5.附录:XSLT的资源
◇ 最权威的网站
◇ 有关标准
XSLT1.0 http://www.w3.org/TR/xslt.html
XSLT1.1 http://www.w3.org/TR/xslt11/
XPath1.0 http://www.w3.org/TR/xpath.html
◇ 学习教程
http://www.wirelessdevnet.com/channels/wap/training/xslt.html
http://msdn.microsoft.com/library/default.asp?URL=/library/psdk/xmlsdk/xslp8tlx.htm
http://www.jenitennison.com/xslt/
◇ 相关资讯
http://www.oasis-open.org/cover/xsl.html#resources
http://www.ibm.com/developer/xml
◇ 相关软件
http://www.xmlsoftware.com/xsl/
◇ 邮件列表