xml约束 ---- DTD
什么是XML约束: 在XML技术里。能够编写一个文档来约束一个XML文档的书写规范。这称之为XML约束。
为什么须要XML约束?
经常使用的约束技术
XML DTD
XML Schema
DTD(Document TypeDefinition)。全称为文档类型定义。
文件清单:book.xml
<?xml version="1.0" ?>
<!DOCTYPE 书架 SYSTEM"book.dtd">
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>张孝祥</作者>
<售价>39.00元</售价>
</书>
<书>
<书名>JavaScript网页开发</书名>
<作者>张孝祥</作者>
<售价>28.00元</售价>
</书>
</书架>
文件清单:book.dtd
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
DTD约束即能够作为一个单独的文件编写,也能够在XML文件内编写。
<?
xml version="1.0"encoding="UTF-8" standalone="yes"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>张孝祥</作者>
<售价>39.00元</售价>
</书>
...
</书架>
XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
当引用的文件在本地时,採用例如以下方式:
<!DOCTYPE 文档根结点 SYSTEM"DTD文件的URL">
比如: <!DOCTYPE 书架 SYSTEM“book.dtd”>。在xml文件里手写一下。
当引用的文件是一个公共的文件时。採用例如以下方式:
<!DOCTYPE 文档根结点 PUBLIC"DTD名称" "DTD文件的URL">
比如:<!DOCTYPE web-app PUBLIC
"-//Sun Microsystems,Inc.//DTD Web Application 2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd">
- 元素定义
- 属性定义
- 实体定义
在DTD文档中使用ELEMENT声明一个XML元素。语法格式例如以下所看到的:
<!ELEMENT 元素名称 元素类型>
元素类型能够是元素内容、或类型
如为元素内容:则须要使用()括起来,如
<!ELEMENT 书架 (书名,作者。售价)>
<!ELEMENT 书名 (#PCDATA)>
如为元素类型,则直接书写,DTD规范定义了例如以下几种类型:
EMPTY:用于定义空元素,比如<br/> <hr/>
ANY:表示元素内容为随意类型。
元素内容中能够使用例如以下方式,描写叙述内容的组成关系
用逗号分隔。表示内容的出现顺序必须与声明时一致。
<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
用|分隔,表示任选其一,即多个仅仅能出现一个
<!ELEMENT MYFILE(TITLE|AUTHOR|EMAIL)>
在元素内容中也能够使用+、*、?
等符号表示元素出现的次数:
+: 一次或多次 (书+)
?
: 0次或一次 (书?
)
*: 0次或多次 (书*)
也可使用圆括号( )批量设置,例
<!ELEMENT MYFILE ((TITLE*, AUTHOR?,EMAIL)* | COMMENT)>
xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
……
>
属性声明举例:
<!ATTLIST 商品
类别 CDATA #REQUIRED
颜色 CDATA #IMPLIED
>
相应XML文件:
<商品 类别="服装" 颜色="黄色">…</商品>
<商品 类别="服装">…</商品>
设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:能够设置也能够不设置
#FIXED:说明该属性的取值固定为一个值,在 XML 文件里不能为该属性设置其他值。但须要为该属性提供这个值
直接使用默认值:在 XML 中能够设置该值也能够不设置该属性值。若没设置则使用默认值。
举例:
<!ATTLIST 页面作者
姓名 CDATA #IMPLIED
年龄 CDATA #IMPLIED
联系信息 CDATA #REQUIRED
站点职务 CDATA #FIXED "页面作者"
个人爱好 CDATA "上网"
>
CDATA:表示属性值为普通文本字符串。
- ENUMERATED
- ID
- ENTITY(实体)
属性的类型能够是一组取值的列表,在 XML 文件里设置的属性值仅仅能是这个列表中的某个值(枚举)
<?xml version = "1.0"encoding="GB2312" standalone="yes"?>
<!DOCTYPE 购物篮 [
<!ELEMENT 肉 EMPTY>
<!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">
]>
<购物篮>
<肉 品种="鱼肉"/>
<肉 品种="牛肉"/>
<肉/>
</购物篮>
表示属性的设置值为一个唯一值。
ID 属性的值仅仅能由字母,下划线開始,不能出现空白字符
<?
xml version = "1.0"encoding="GB2312" ?>
<!DOCTYPE 联系人列表[
<!ELEMENT 联系人列表 ANY>
<!ELEMENT 联系人(姓名,EMAIL)>
<!ELEMENT 姓名(#PCDATA)>
<!ELEMENT EMAIL(#PCDATA)>
<!ATTLIST 联系人 编号 ID #REQUIRED>
]>
<联系人列表>
<联系人 编号="1">
<姓名>张三</姓名>
<EMAIL>zhang@it315.org</EMAIL>
</联系人>
<联系人 编号="2">
<姓名>李四</姓名>
<EMAIL>li@it315.org</EMAIL>
</联系人>
</联系人列表>
实体用于为一段内容创建一个别名,以后在XML文档中就能够使用别名引用这段内容了。
在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
实体可分为两种类型:引用实体和參数实体。
引用实体主要在 XML 文档中被应用
语法格式:
<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容
引用方式:
&实体名称;
举例:
<!ENTITY copyright “I am aprogrammer">
……
©right; <!--引用的方式-->
參数实体被 DTD 文件自身使用
语法格式:
<!ENTITY % 实体名称 "实体内容" >
引用方式:
%实体名称;
举例1:
<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
<!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>
<!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>
举例2:
<!ENTITY % common.attributes
" id ID #IMPLIED
account CDATA #REQUIRED "
>
...
<!ATTLIST purchaseOrder%common.attributes;>
<!ATTLIST item%common.attributes;>