带你快速上手XML
带你快速上手XML
一、XML约束
1、简介
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
2、常用的约束技术
XML DTD
XML Schema
3、DTD约束快速入门
(1)DTD(Document Type Definition),全称为文档类型定义。
(2)DTD文件应使用UTF-8或Unicode
二、编程校验XML文档正确性
1、XML解析工具
IE5以上浏览器内置了XML解析工具:Microsort.XMLDOM,开发人员可以编写javascript代码,利用这个解析工具装载xml文件,并对xml文件进行dtd验证
2、创建xml文档解析器对象
var xmldoc = new ActiveXObject("Microsoft.XMLDOM");
3、开启xml校验
xmldoc.validateOnParse = "true";
4、装载xml文档
xmldoc.load("book.xml");
5、获取错误信息
xmldoc.parseError.reason;
xmldoc.parseError.line
6、DTD约束
可以作为一个单独的文件编写,也可以在XML文件内编写。
三、DTD约束
1、DOCTYPE声明语句
XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
(1)当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>
(2)当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
例如:<!DOCTYPE web-app PUBLIC
"-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd">
2、约束语法
(1)元素定义
在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
<!ELEMENT 元素名称 元素类型>
(2)属性定义
xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
……
>
设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:可以设置也可以不设置
#FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值,但需要为该属性提供这个值
直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值,若没设置则使用默认值。
(3)常用属性值类型
CDATA:表示属性值为普通文本字符串。
ENUMERATED
ID
ENTITY(实体)
3、实体定义
(1)实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。实体可分为两种类型:引用实体和参数实体。
(2)引用实体
语法格式:
<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容
引用方式:
&实体名称;
(3) 参数实体
参数实体被 DTD 文件自身使用
语法格式:
<!ENTITY % 实体名称 "实体内容" >
引用方式:
%实体名称;
四、XML Schema
1、简介
XML Schema 也是一种用于定义和描述 XML 文档结构与内容的模式语言,其出现是为了克服 DTD 的局限性
2、XML Schema 和 DTD区别
(1)XML Schema符合XML语法结构。
(2)DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
(3)XML Schema对名称空间支持得非常好。
(4)XML Schema比XML DTD支持更多的数据类型,并支持用户自定义新的数据类型。
(5)XML Schema定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制。
(6)XML Schema不能像DTD一样定义实体,比DTD更复杂,但Xml Schema现在已是w3c组织的标准,它正逐步取代DTD。
3、基础
(1)XML Schema 文件自身就是一个XML文件,但它的扩展名通常为.xsd。
(2)一个XML Schema文档通常称之为模式文档(约束文档),遵循这个文档书写的xml文件称之为实例文档。
(3)XML Schema文档也必须有一个根结点,但这个根结点的名称为Schema。
4、名称空间
(1)在XML Schema中,每个约束模式文档都可以被赋以一个唯一的名称空间,名称空间用一个唯一的URI(Uniform Resource Identifier,统一资源标识符)表示。 在Xml文件中书写标签时,可以通过名称空间声明(xmlns),来声明当前编写的标签来自哪个Schema约束文档。
(2)使用名称引入Schema
为了在一个XML文档中声明它所遵循的Schema文件的具体位置,通常需要在Xml文档中的根结点中使用schemaLocation属性来指定。schemaLocation此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置,两者之间用空格分隔。
(3)使用默认名称空间
基本格式:xmlns=“URI”
(4)声明名称空间
targetNamespace元素用于指定schema文档中声明的元素属于哪个名称空间。
elementFormDefault元素用于指定,该schema文档中声明的根元素及其所有子元素都属于targetNamespace所指定的名称空间。