XSLT轻松入门

1.XSLT的概念

1.1 什么是XSLT
1.2 为什么要用XSLT
1.3 XSLT的历史
1.4 什么是XPath
1.5 XSLT和CSS的比较
1.6 XSLT和IE5

1.XSLT的概念

我们首先来澄清一个概念，大家可能听说过XSL(eXtensible Stylesheet Language)，XSL和我们这里说的XSLT从狭义上理解是一样的,而按照W3C的标准，XSLT的说法更严格些，因此我们在文章中统一使用XSLT的称法。它们之间具体的关系我们会在下面讲述。

1.1 什么是XSLT

XSLT的英文标准名称为eXtensible Stylesheet Language Transformation。根据W3C的规范说明书(http://www.w3.org/TR/xslt)，最早设计XSLT的用意是帮助XML文档(document)转换为其它文档。但是随着发展，XSLT已不仅仅用于将XML转换为HTML或其它文本格式，更全面的定义应该是：

XSLT是一种用来转换XML文档结构的语言。

1.2 为什么要用XSLT

我们已经知道，XML是一种电脑程序间交换原始数据的简单而标准的方法。它的成功并不在于它容易被人们书写和阅读，更重要的是，它从根本上解决了应用系统间的信息交换。因为XML满足了两个基本的需求：

(1).将数据和表达形式分离。就象天气预报的信息可以显示在不同的设备上，电视，手机或者其它。

(2).在不同的应用之间传输数据。电子商务数据交换的与日俱增使得这种需求越来越紧迫。

为了使数据便于人们的阅读理解，我们需要将信息显示出来或者打印出来，例如将数据变成一个HTML文件，一个PDF文件，甚至是一段声音；同样，为了使数据适合不同的应用程序，我们必须有能够将一种数据格式转换为另一种数据格式，比如需求格式可能是一个文本文件，一个SQL语句，一个HTTP信息，一定顺序的数据调用等。而XSLT就是我们用来实现这种转换功能的语言。将XML转换为HTML，是目前XSLT最主要的功能。

1.3 XSLT的历史

想很多其他XML家族成员一样，XSLT是由W3C起草和制定的。它的主要发展历程如下：

.1995年由James Clark提议；

.1997年8月正式提案为XSL；

.1998年5月由Norman Walsh完成需求概要；

.1998年8月18日XSL草案发布；

.1999年11月16日正式发布XSL 1.0推荐版本。

目前，XSLT仍然在快速的发展中，XSLT1.1的草案已经可以在W3C网站(http://www.w3.org/TR/xslt11)上看到。

1.4 什么是XPath

XPath是XSLT的重要组成部分，我们将在第四章讲解它的详细语法。那么XPath是什么呢？我们首先来了解一下XSL系列的"家族"关系。如下图：

XSL在转换XML文档时分为明显的两个过程，第一转换文档结构；其次将文档格式化输出。这两步可以分离开来并单独处理，因此XSL在发展过程中逐渐分裂为XSLT(结构转换)和XSL-FO(formatting objects)(格式化输出)两种分支语言，其中XSL-FO的作用就类似CSS在HTML中的作用。而我们这里重点讨论的是第一步的转换过程，也就是XSLT。

另外，在学习XML时我们已经知道XML是一个完整的树结构文档。在转换XML文档时可能需要处理其中的一部分(节点)数据，那么如何查找和定位XML文档中的信息呢，XPath就是一种专门用来在XML文档中查找信息的语言。XPath隶属XSLT，因此我们通常会将XSLT语法和XPath语法混在一起说。

用一种比较好理解的解释：如果将XML文档看作一个数据库，XPath就是SQL查询语言；如果将XML文档看成DOS目录结构，XPath就是cd,dir等目录操作命令的集合。

1.5 XSLT和CSS的比较

CSS同样可以格式化XML文档，那么有了CSS为什么还需要XSLT呢？因为CSS虽然能够很好的控制输出的样式，比如色彩，字体，大小等，但是它有严重的局限性，就是：

(1) CSS不能重新排序文档中的元素；

(2) CSS不能判断和控制哪个元素被显示，哪个不被显示；

(3) CSS不能统计计算元素中的数据；

换句话说，CSS只适合用于输出比较固定的最终文档。CSS的优点是简洁，消耗系统资源少；而XSLT虽然功能强大，但因为要重新索引XML结构树，所以消耗内存比较多。

因此，我们常常将它们结合起来使用，比如在服务器端用XSLT处理文档，在客户端用CSS来控制显示。可以减少响应时间。

1.6 XSLT和IE5

在XSLT草案发布不久，微软就在IE4中提供了支持XSL功能的预览版本，到IE5.0发布时，正式全面支持XSLT，可是由于IE5发布的比XSLT1.0标准时间早，因此在IE5.0中支持的XSTL功能和XSLT 1.0略有不同。(呵呵~~XML推行的主要原因之一就是解决HTML过分依赖浏览器的问题，现在微软又想标新立异？)。好在微软的IE5.5中执行的标准已经和W3C的XSLT1.0基本相近。但令人头疼的是IE5.0已经发行了几百万套，您使用的XSLT很可能不能被客户的浏览器正确执行。目前XSLT 1.1仍在发展中，W3C及有关组织也在和微软协商争取获得统一。呵呵~~故事还远远没有结束噢。

注意：本文中提到的语法都是根据XSLT 1.0的标准来讲的，没有任何微软的"方言"。

2. XSLT的实例

2.1 XSLT如何转换XML
2.2 一个实例
2.3 过程解析
2.4 XSLT的用途

2.1 XSLT如何转换XML

我们打个有趣的比方，你玩过橡皮泥吧，用不同的模子按上去，就可以做出需要的形状。如果我们假设XML数据文档是一块大橡皮泥，XSLT就象是一个模子，用力一按，就做出需要的形状来---符合不同需要的HTML文档。

具体看下面的过程示意图:

我们将XML原文档输入，用XSL作为模板，通过转换引擎，最终输出需要的HTML文档。其中的转换引擎就是比喻中"用力一按"的过程。在具体应用中，有专门的软件来实现这个转换过程，名为XML Processor。目前已经有很多 Processor 软件(下面将详细提到)，在IE5.5中也已经内嵌了XML Processor。

2.2 一个实例

现在我们来看一个简单的XSLT实际应用例子，获得一些感官上的认识。很多网页设计师看到类似HTML的代码才会放心，代码是那样的亲切和熟悉。

例子1: "Hello, world!"

hello world作为第一个教程已经是程序语言中的惯例了。我们也遵守这个惯例，看看如何利用XSLT来显示"hello world"。虽然这个例子没有什么实际用途，但是请大家不要急，后面还有更详细的例子。

第一步：建立要输入XML文档hello.xml。

<?xml version="1.0" encoding="iso-8859-1"?>

<greeting>Hello, world!</greeting>

这是一个很简单XML文档，只包含一个节点的XML结构树。

第二步：建立XSLT文档hello.xsl。提示：默认的XSLT文件的后缀名为.xsl。

<?xml version="1.0" encoding="iso-8859-1"?>

<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">

<xsl:template match="/">

<html>

<head>

<title>First XSLT example</title>

</head>

<body>

<xsl:value-of select="greeting"/>

</body>

</html>

</xsl:template>

</xsl:stylesheet>

你现在可以用IE5.0以上版本浏览器打开这个hello.xsl文件，看到XSL的结构树。

第三步：在XML中调用这个XSL文件。修改hello.xml的代码为：

<?xml version="1.0" encoding="iso-8859-1"?>

<?xml-stylesheet type="text/xsl" href="hello.xsl"?>

<greeting>Hello, world!</greeting>

ok,到这一步原理上已经完成了所有的代码，接下来只要用一个XSLT的处理器(XML Processor)来执行hello.xml就可以看到"hello
world"的显示结果了。流行的处理器软件有以下几种：

(1).James Clark的XT。下载网址：http://www.jclark.com/xml/xt.html

(2).IBM的XML for Java软件包，名为LotusXSL。下载网址：www.alphaworks.ibm.com/tech/xml4j

(3).Saxon。下载网址：http://www.wrox.com

(4).微软的MSXML3。下载网址：http://www.microsoft.com/xml

有网友要问，我想在浏览器中看到"hello world"的效果应该怎么做？在微软的IE5.5内嵌了MSXML3解释器，你可以用IE5.5打开hello.xml文件，就可以看到结果。如果只看到XML结构树，不是单独的"hello
world"字样，说明你的浏览器没有安装MSXML3版本。

如果没有安装又想看效果怎么办？那还是用我们在XML教程中的老办法，采用JS实现。(这已经超出了本文要讲的范围，但为了更加直观，便于理解，我们在这里提供实例代码。)下面是一种实现的代码，可以保存为hello.htm，和上面的hello.xml，hello.xsl放在同一目录下面。最后用IE5.0以上版本打开hello.htm就可以看到效果了。

<html>

<head>

var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");

xmlDoc.async="false";

xmlDoc.load("hello.xml");

nodes = xmlDoc.documentElement.childNodes;

greeting.innerText = nodes.item(0).text;

</script>

<title>First XSLT Example</title>

</head>

</body>

</html>

2.3 过程解析

如果你成功的看到效果，你也许想知道这些代码的具体含义，我们来详细解说：看hello.xsl文件

<?xml version="1.0" encoding="iso-8859-1"?>

这是标准的XML文档的首行代码，因为XSLT本身也是XML文档。encoding属性用来定义文档使用的编码形式，iso-8859-1主要支持西欧和北美的语言编码。如果你想使用简体中文，那么就应该写成：

<?xml version="1.0" encoding="GB2312"?>

接下去的代码是:

<xsl:stylesheet

xmlns:xsl="http://www.w3.org/1999/XSL/Transform"

version="1.0">

这是标准的XSLT文件首行代码。xsl:stylesheet代码的意思是将文档作为一个样式表来(stylesheet)处理。xmlns:xsl属性是一个名字空间声明，和XML中的名字空间使用方法一样，用来防止元素名称重复和混乱。其中前缀xsl的意思是文档中使用的元素遵守W3C的XSLT规范。最后的version属性说明样式表只采用XSLT
1.0的标准功能，这也是目前仅有的标准。

<xsl:template match="/">

一个<xsl:template>元素定义一个模板规则。属性match="/"说明XML源文档中，这个模板规则作用的起点。"/"是一种XPath语法，我们在后面将详细讲述，这里的"/"代表XML结构树的根(root)。

接下去的代码是:

<html>

<head>

<title>First XSLT Example</title>

</head>

<body>

<xsl:value-of select="greeting"/>

</body>

</html>

说明：当模板规则被触发，模板的内容就会控制输出的结果。例子中，模板大部分内容由HTML元素和文本构成。只有<xsl:value-of>元素是XSLT语法，这里<xsl:value-of>的作用是拷贝原文档中的一个节点的值到输出文档。而select属性则详细指定要处理的节点名称。这是XPath语法，"greeting"的意思就是寻找根节点名为greeting的元素，并用模板来处理这个节点。具体的就是找到<greeting>元素，然后将元素的值"hello
world"按模板样式拷贝到输出文件。

提示：由于XML文档是严格的层级结构(用IE5查看XML文件，会看见XML文档类似多级关联菜单)，所以我们形象的称XML文档为文档树，其中每一对元素称作树的一个节点。根元素就是根节点。

最后关闭所有元素：

</xsl:template>

</xsl:stylesheet>

好，例子解说完毕。你是否想过为什么要用这么复杂的方法来显示"hello world"呢？

关键不在表面，而在于实质：用这种方法，hello world可以从XML文档中被提取出来，并用各种不同的XSLT模板处理，来输出不同需求的文档。我们来看看XSLT的主要用途：

2.4 XSLT的用途

XSLT的主要用途就是数据转换应用。

由于以XML为基础的电子商务广泛普及，XSLT作为数据转换的角色也越来越重要。例如直接将电视新闻的数据格式转换成报纸新闻需要的数据格式；将股票数据直接转换成图片显示在网页上；对EDI(电子数据交换)数据进行统计，排序等等。

XSLT是处理类似工作的理想工具。

　　通过前面两章的介绍，我们已经对XSLT的基本概念和它的转换过程有了一些了解。下面我们一起来学习XSLT的具体语法。说到语法总是比较枯燥的，您可以大体上浏览一遍，等您真正需要使用XSLT的时候，再仔细研究它们。

3.XSLT的元素语法

3.1 xsl:template和xsl:apply-templates

3.2 xsl:value-of

3.3 xsl:for-each

3.4 xsl:if

3.5 Xxsl:choose, when, otherwise

3.6 xsl:sort

3.1 xsl:template和xsl:apply-templates

模板(template)是XSLT中最重要的概念之一。XSLT文件就是由一个一个的模板组成，任何一个XSLT文件至少包含一个模板。模板的概念就象是搭积木；你如果是程序员，也可以将模板看作一个方法，一个类，或者一个模块。它们可以被拼装组合，也可以单独成块，不同的模板控制不同的输出格式。

模板(template)由两部分组成：匹配模式(match pattern)和执行。简单的讲模式定义XML源文档中哪一个节点将被模板处理，执行则定义输出的是什么格式。两部分对应的语法为xsl:template和xsl:apply-templates。

xsl:template的语法是：

<xsl:template

match = pattern

name = qname

priority = number

mode = qname>

</xsl:template>

xsl:template的作用是定义一个新模板。属性中name,priority,和mode用来区别匹配同一节点的不同模板。它们不是常用的属性。match属性则控制模板的匹配模式(pattern)，匹配模式是用来定位XML源文档中哪一个节点被模板处理。一个模板匹配一个节点。我们用一个例子来帮助理解：

假设我们要处理一个包含章节和段落文档。我们用para元素定义段落，用chapter元素定义章节。我们来看看match属性可能的值。下面的语句写法说明模板匹配所有的para元素

<xsl:template match="para">

</xsl:template>

下面的语句写法说明模板匹配所有的para元素和所有的chapter元素：

<xsl:template match="(chapter|para)">

</xsl:template>

下面的语句写法说明模板匹配所有的父节点为chapter元素的para元素：

<xsl:template match="chapter//para">

</xsl:template>

下面的语句写法说明模板匹配根节点:

<xsl:template match="/">

</xsl:template>

我们再来看apply-templates语法：

<xsl:apply-templates

select = node set-expression

mode = qname>

</xsl:apply-templates>

xsl:apply-templates用来执行那一个节点被模板具体处理。你可以将它理解为程序中调用子函数。select属性用来定义确切的节点名称。xsl:apply-templates总是包含在xsl:template元素中，象这样：

<xsl:template match="/">

<xsl:apply-templates select="para"/>

</xsl:template>

这段代码说明摸板匹配整个文档(根节点)，具体执行时处理根节点下所有para元素。

<xsl:template match="para">

<xsl:apply-templates/>

</xsl:template>

而这一段代码则表示摸板匹配para节点，所有para下的子元素都将被处理。

3.2 xsl:value-of

XSL:value-of用来将源文档中元素的文本值写到输出文档中。例如：

有一个个人资料的XML文档：

<?xml version="1.0" encoding="iso-8859-1"?>

</PERSON>

我如果想在输出文档中显示上面这个XML源文档中的name元素的值，可以这样写XSLT代码：

<xsl:template match="PERSON">

<xsl:value-of select="name"/>

</xsl:template>

执行后，你会看到"ajie"被单独显示出来。其中match="PERSON"定义摸板匹配PERSON节点，xsl:value-of
语法说明需要输出一个节点的值，而select="name"则定义需要被输出的元素为name。看这个过程是不是和数据库里查询一个人的名字很象？当然，xsl:value-of查询还有更多，更复杂的语法，因为是涉及寻找和定位的功能，我们会放在后面的XPath语法中在仔细讲解。

同样功能的还有xsl:copy-of，用法一样，就不重复解释了。

3.3 xsl:for-each

xsl:for-each语法允许你循环处理被选择的节点。例如：有一个含多个个人资料的XML文档：

<?xml version="1.0" encoding="iso-8859-1"?>

</PERSON>

</PERSON>

<name>miake</name>

</PERSON>

</PEOPLE>

我需要显示所有人的姓名，则可以将XSLT代码写成：

<xsl:template match="PEOPLE">

<xsl:for-each select="child::PERSON">

<xsl:value-of select="name"/>

</ xsl:for-each>

</xsl:template>

3.4 xsl:if

xsl:if类似普通程序语言的if条件语句，允许设定节点满足某个条件时，被模板处理。xsl:if的语法格式为：

<xsl:if test=布尔表达式>

template body

</xsl:if>

例如：

<xsl:template match="PEOPLE">

<xsl:if test="@name">

<xsl:value-of select="@name"/>

</xsl:if>

</xsl:template>

这段代码的意思是检测PEOPLE节点下所有的元素，如果发现有<name>元素，则将<name>元素的值输出。其中@符号是统配符，表示节点下所有的元素。

3.5 xsl:choose, xsl:when 和 xsl:otherwise

xsl:if语法没有else的属性。如果我们要进行多项选择，那么就要使用xsl:choose / xsl:when / xsl:otherwise系列流程控制语法了。具体的使用请看下面的XSL文件例子：

<xsl:template match="PEOPLE">

<xsl:choose>

<xsl:when test="@name = 'ajie'">

<xsl:value-of select="@name"/>

</xsl:when>

<xsl:when test="@name">

<xsl:value-of select="@name"/>

</xsl:when>

<xsl:otherwise>

No name available

</xsl:otherwise>

<xsl:choose>

</xsl:template>

说明：首先在PEOPLE节点下寻找<name>属性值为ajie的元素，如果找到，将ajie用粗体输出；如果没有发现值为ajie的<name>元素，则将所有的<name>元素的值都用斜体输出；如果没有发现任何<name>元素，则显示"No
name available"。

3.6 xsl:sort

在XSLT中可以对XML源文档的元素进行重新排序，排序的语法就是xsl:sort。举例：下面的代码就是将文档元素按name排序。

<xsl:template match="PEOPLE">

<xsl:apply-templates select="PERSON">

<xsl:sort select="@name"/>

</xsl:apply-templates>

</xsl:template>

以上是XSLT的元素的主要语法，还有很多其他的语法，例如：import, include, element, attribute, number, param等等语法，在这里就不一一解释。我们的目的是让您对XSLT的语法有基本的概念，理解XSLT作为一种转换语言的强大功能。

4.XPath的语法

我们在前面已经提到过，XPath是用来帮助XSLT在XML源文档中查找定位信息的语言。在实际使用过程中，XPath和XSLT总是混在一起使用，在上面一章的语法例子中我们已经有使用到XPath的语法，只是没有明确点出。但W3C将它们分成两个标准，所以我们也将它们拆成两章来讲解。

4.XPath的语法

4.1 当前位置
4.2 寻址操作
4.3 运算符
4.4 功能函数

4.1 当前位置

当我们使用XSLT处理XML源文档是，我们用Context来表示当前正在被模板处理的节点位置。比如xsl:template match="/"语句中表示Context在文档的根(root)节点。我不知道如何准确的翻译Context这个词，它类似于C语言里的指针，表示程序当前运行的位置。理解Context对于正确处理XSL模板非常重要，当您的XSL模板输出的文档和您想要的不一样，最先应该分析的就是Context在哪里。
Location Paths是用于设定你想要寻找的Context节点位置。就类似DOS的目录命令。我们看个例子

<xsl:for-each select="child::PEOPLE/descendant::PERSON">

其中child::PEOPLE/descendant::PERSON就是XPath语法，这个表达式就是一个Location Paths，代码说明要显示所有PEOPLE元素的子元素和所有PERSON元素的子元素。通常我们会采用更简单的写法：

<xsl:for-each select="PEOPLE//PERSON">

我们来解释path的两种表示方法："/"和"//"。
"/"是表示当前文档的节点,类似DOS目录分割符。例如：/PEOPLE表示选择根节点下的PEOPLE元素；PEOPLE/PERSON表示选择PEOPLE元素下所有的PESON子元素。
"file://"则表示当前文档所有的节点。类似查看整个目录。例如：//PEOPLE表示选择文档中所有的PEOPLE元素，无论它在什么层次；PEOPLE//PERSON表示在PEOPLE元素下所有的PERSON元素，无论它的层次多深。

4.2 寻址操作

Axis和Predicate是XPath语法中对Location Paths进行定位操作的语法，具体的用法列表如下

Axis语法表
--------------------------------------------------------
表达式简写说明
--------------------------------------------------------
self . 选择当前的节点.。
例子 :
<TD><xsl:value-of select="."/></TD>
代码表示在当前位置插入当前的节点包含的文本(text)值，
--------------------------------------------------------
parent .. 选择当前节点的父节点。
--------------------------------------------------------
attribute @ 选择一个元素的所有属性。
例子:
<TD><xsl:value-of select="@PERSONID"/></TD>
选择PERSON元素的所有属性.
--------------------------------------------------------
child 选择当前节点的所有子元素。
--------------------------------------------------------
ancestor 选择当前节点的所有父元素(包括父元素的父元素，类推)
--------------------------------------------------------

Axis帮助我们选择当前节点周围所有的节点，而Predicate则用来定位当前节点内部的元素。表示方法为方括号[]中加表达式：[ Expression ]。具体举例如下:

PERSON[position()=2]
这句代码表示寻找第二个"PERSON" 元素

PERSON[starts-with(name, "B")]
这句代码表示寻找所有名称以"B"开头的PERSON元素。

4.3 运算符

这一节介绍XPath的运算符(Expressions)，列表如下：
--------------------------------------------------------
运算符说明
--------------------------------------------------------
and, or 就是普通意义的and, or
--------------------------------------------------------
= 等于
--------------------------------------------------------
!= 不等于
--------------------------------------------------------
>, >= 大于，大于等于
--------------------------------------------------------
<, <= 小于，小于等于。注意：在XSL文件中，<符号要用< 表示
--------------------------------------------------------
+, -, *, div 加减乘除
--------------------------------------------------------
mod 取模
--------------------------------------------------------
| 两个节点一起计算
--------------------------------------------------------

4.4 功能函数(Functions)

在XPath里有很多功能函数可以帮助我们精确寻找需要的节点。

count()功能
作用：统计计数，返回符合条件的节点的个数。
举例：<xsl:value-of select="count(PERSON[name=tom])"/>
说明：代码的用途是显示PERSON元素中姓名属性值为tom有几个。

number()功能
作用：将属性的值中的文本转换为数值。
举例：The number is: <xsl:value-of select="number(book/price)"/>
说明：代码的用途是显示书的价格。

substring() 功能
语法：substring(value, start, length)
作用：截取字符串。
举例：<xsl:value-of select="substring(name, 1, 3)"/>
说明：代码的用途是截取name元素的值，从第一个字母开始显示到第三个。

sum()功能
作用：求和。
举例：Total Price = <xsl:value-of select="sum(//price)"/>
说明：代码的用途是计算所有价格的和。

上面这些功能只是XPath语法中的一部分，还有大量的功能函数没有介绍，而且目前XPath的语法仍然在不断发展中。通过这些函数我们可以实现更加复杂的查询和操作。

看到这里，我们的入门教程就快结束了。通过走马观花式的快速学习，希望大家对XSLT应该有了一点基本概念：XSLT是一种转换XML文档的语言，它包含两个过程：转换和格式化。XSLT的功能比CSS强大得多，它有类似数据查询的语法。如果您对XSLT感兴趣，那么以上的知识是远远不够的，需要查询更多的资料。阿捷在最后一章附录为大家提供了主要的XSLT资源。

5.附录：XSLT的资源

◇ 最权威的网站

http://www.w3.org/Style/XSL/

◇ 有关标准

XSLT1.0 http://www.w3.org/TR/xslt.html

XSLT1.1 http://www.w3.org/TR/xslt11/

XPath1.0 http://www.w3.org/TR/xpath.html

◇ 学习教程

http://www.w3schools.com/xsl/

http://www.wirelessdevnet.com/channels/wap/training/xslt.html

http://msdn.microsoft.com/library/default.asp?URL=/library/psdk/xmlsdk/xslp8tlx.htm

http://www.jenitennison.com/xslt/