PHP与XML技术

XML的概述

XMLeXtensibleMarkup Language,扩展性标记语言,它是用来描述其他语言的语言。它允许用户设计自己的标记。XML是由W3CWorldWide WebConsortium,互联网联合组织)于19982月发布的一种标准;它的前身是SGMLStandardGeneralized MarkupLanguage,标准通用置标语言)。XML产生的原因是为了补充HTML语言的不足,使网路语言更规范化、多样化。

  HTML语言被称为第一代web语言,现在的版本为4.0,以后将不再更新,取而代之的是XHTML。而XHTML正是根据XML来制定的。XML有如下特点:

  1)易用性:XML可以使用多种编辑器来进行编写,包括记事本等所有的纯文本编辑器。

  2)结构性:XML是具有层次结构的标记语言,包括多层的嵌套。

  3)开放性:XML语言允许开发人员自定义标记,这使得不同的领域都可以有自己的特色方案。

  4)分离性:XML语言将数据的显示和数据内容分开保存,各自处理。使得基于XML的应用程序可以在XML文件中准确高效地搜索相关的数据内容,忽略其他不相关部分。

XML语法 

     XML文档结构

在开始讲解XML语法之前,先来熟悉一下XML的文档结构,代码如下:

  <?xmlversion="1.0" encoding="gb2312"standalone="yes"?>

  <?xml-stylesheet type="text/css"href="Book.css"?>

  <!--  下面的标签<计算机图书>就是这个XML文档的根目录  -->

  <计算机图书>

  <PHP>

  <书名>PHP程序开发范例宝典</书名>

  <价格 单位="/">89.00</价格>

  <出版时间>2007-09-01</出版时间>

  </PHP>

  </计算机图书>

  这就是一个XML文档的最基本的元素,包括XML声明、处理指令(PI)、注释、元素等等,下面就来一一说明。

XML声明

XML声明在文档中只能出现一次,而且必须是在第一行,连空行也不允许存在。XML声明包括了XML版本、编码等信息。示例如下:

  <?xml version="1.0"encoding="gb2312" standalone="yes"?>

  XML声明的各部分的含义如表所示。

处理指令

顾名思义,就是如何处理XML文档的指令。有一些XML分析器可能对XML文档的应用程序不做处理,这时可以指定应用程序按照这个指令信息来处理,然后在传给下一个应用程序。XML声明其实就是一个特殊的处理指令。处理指令的格式为:

  <?处理指令名 处理执行信息?>

  例如:下面创建一个处理指令,代码如下。

  <?xml-stylesheettype = "text/css"href="Book.css"?>

  具体含义是:

  xml-stylesheet:样式表单处理指令。指明了该XML文档所使用的样式表。

  type="text/css":设定了文档所使用的样式是css

  href="Book.css":设定了样式文件的地址。

注释

XML中的注释和HTML是一样的,使用“<!--”和“-->”作为开始和结束界定符。注释的用法十分简单,这里只介绍一下在使用注释时要注意的几个问题。

l  不能出现在XML声明之前。
l  不能出现在XML元素中间。如:<computer_book<!--  这是错误的 -->>
l  不能出现在属性列表中。
l  不可嵌套注释。
l  注释内容可以包含“<”“>”“&”这些特殊字符,但不允许有“--”
XML元素

元素是每个XML文档不可或缺的部分,也是文档内容的基本单元。每个XML文档至少要包含一个元素。一般的元素由三部分组成,格式如下:

  <标签>数据内容</标签>

  其中<标签>为元素的开始标签,</标签>是元素的结束标签,中间的数据内容是元素的值。这里要注意的是标签的写法:

l  <标签></标签>都是成对出现的,这是XML严格定义的。不允许只有开始标签而没有结束标签,对于空元素,即两个标签之间没有数据,这时可以使用简短形式:<标签/>
l  英文标签名称只能由下划线“_”或英文字开头,中文标签名称只能使用下划线“_”或汉字开头。名称中只能有下划线“_”、连接符“-”、点“.”和冒号“:”几个特殊字符,也可以使用指定字符集下的合法字符。
l  <标签>中不能有空格。<标签></标签>都是错误的。
l  <标签>对英文大小写很敏感。如<name><Name>是两个不同的标签。
XML属性

XML属性是XML元素中的内容,是可选的。XML属性和HTML中的属性在功能上十分的相似,但XML属性在格式上更加严格,使用上更加灵活。XML属性的格式为:

  <标签 属性名="属性值"属性名=""…>内容</标签>

  这里要注意:

l  属性名和属性值必须是成对出现的,不像HTML中有的属性,可以不需要值而单独存在。对于XML来说这是不可能的。如果没有值,写成“属性名=""”也可以。
l  属性值必须用引号括起来。通常使用双引号,除非属性值本身包含了双引号,这时可以用单引号来代替。

使用CDATA标记

XML中对于特殊字符“>”、“<”和“&”的输入需要使用实体引用来处理,实体引用就使用“&…;”的形式来代替那些特殊字符。表是XML中所用到的实体引用。

CDATA标记的格式如下:

  <![CDATA[

 

  ]]>

  例如:创建一个XML文件,并且通过实体引用和CDATA标记来显示特殊符号,其代码如下:

  <?xmlversion="1.0" encoding="GB2312"?>

  <exam>

  <实体引用>这里必须使用引用“&lt;”、“&gt;”、“&amp;”</实体引用>

  <CDATA标记>

  <![CDATA[

  这里可以正常输出“<”、“>”、“&”

  ]]>

  </CDATA标记>

  </exam>

XML命名空间

命名空间通过在元素前面增加一个前缀来保证元素和属性的唯一性。它的最重要用途是用于融汇不同的XML文档。命名空间的格式为:

  <标签名称 xmlns:前缀名称="URL">

  例如:在创建的XML文件中,对元素<外语图书>使用命名空间,代码如下。

  <?xml version="1.0"encoding="gb2312" standalone="yes"?>

  <外语图书 xmlns:frn="http://www.bccd.com/foreign">

  <frn:English>

  <frn:书名>许国璋英语</frn:书名>

  <frn:价格货币种类="RMB"单位="4">80.00</frn:价格>

  <frn:出版时间>1996-05-10</frn:出版时间>

  </frn:English>

  </外语图书>


版权声明:本文为小平果原创文章,转载请注明:http://blog.csdn.net/i10630226

posted @ 2014-10-26 13:55  dingxiaoyue  阅读(281)  评论(0编辑  收藏  举报