掌握XML系列(2)--创建格式良好的XML文档
创建格式良好的XML文档,其实就是使得我们的XML文档能够符合W3C的XML1.0规范,相信大家也不想看W3C条条框框的规范,我们就从实际出发,来说说,怎么
样写XML文档.
1.XML中元素:
前面我们说过,XML的语法要求很严格的,所有的XML标记要关闭的.包含两点:首先.每个XML的开始标记,如<person>都必须有一个XML的结束标记</person>,例子如下:
Code
<person>
<name>
<firstname>xiao</firstname>
<lastname>yang</lastname>
</name>
</person>
其次就是,如果元素没有子元素或者数据,那么就使用空元素的语法来关闭.如:
<person>
<name firstname="xiao" lastname="yang"/>
</person>
所以,要关闭所有的元素,而且每个层结结构都必须在相同的级别上打开和关闭,如下就不正确:
<person>
<name>
//---------------------
<firstname>xiao
</name>
</firstname>
//--------------------
</person>
大家看看中间我用两条线标记的部分,<name>是<firstname>的父元素,但是他们关闭的层次有问题,应该先关闭firstname,然后才是name.
以上讲的只是创建良好XML文档的最基本的规则,下面我们就来详细的说下更多的规则,我会在中间穿插很多的例子,避免枯燥.
1.1文档根的
XML文档必须有唯一的文档根.根元素包含其余的文档数据,换言之,其余的部分就是根元素的子元素,如下就不不对:
<?xml version="1.0" ?>
<capitals>
<country name="china">beijing</country>
<country name="usa">w d.c</country>
</capitals>
<population>
<num>12</num>
</population>
上面的文档有两个根元素<capitals>和<population>,所以格式不良好,要使得格式良好就要改改.如下(其实改的方式很多的,只要有唯一的根元素就行):
<?xml version="1.0" ?>
<data>
<capitals>
<country name="china">beijing</country>
<country name="usa">w d.c</country>
</capitals>
<population>
<num>12</num>
</population>
</data>
上面的就行了.
1.2 合法和不合法的名称
在XML中使用元素要遵守一些命名规范,即区分大小写等.下面的就是代表不同的元素,尽管意思一样:
,<person>,<PERSON>,<Person>.
此外还有一些规则:
(1)"<"字符之后不能存在空格,如<person name>就不行,而<personname>就可以
(2) 元素的名字不能以数字或者标记符号开头,可以以字母和下划线开头:如<2name>不合法,而,<_2name>合法.
(3)第一个字符之后可以有"-"".":如<.name>不合法,而<name.firstname>合法
(4)不要使用冒号:因为这会与以后要说的命名空间冲突,所以<name:firstname>不合法.
(5)最好不要用任何形式的xml开头,如<xml_name><Xml_name>就不行,因为一般的xml解析器对此有要求的.
其实XML中规则也不是那么的多,就像我们当初学习任何一门语言,如C#,都有语法的要求,大家用多了就自然明白了,也不会在乎那么多.所以,xml也一样,大家看
多了,自然就认为这些规则也熟悉.
1.3 非法的字符
在开始和结束标记之间的文本称为解析过的字符数据或者PCDATA,,可以在数据中使用除了"<"和"&"以外的任意字符,所以下面的例子:
<?xml version="1.0" ?>
<person>
<hello&
</person>
把上面的文件保存为person.xml,然后用浏览器打开就会看见如下:
因为在浏览器中有内置的解析器.可以检查XML文档格式良好
1.4实体引用
关于实体引用大家应该都熟悉的,因为在html也有,
& 的xml实体引用就是& 举例:如果向在xml文档中显示 xiao&yang 那么就就要在编写xml文档时用xiao&yang
<的xml实体引用就是 <
>的xml实体引用就是>
'(单引号)xm实体引用是'
"(双引号)xml实体引用是&quto;
注意:上面的一些字符,当你想在PCDATA中输入时,就要用他们饿实体引用
注意PCDATA的概念 下面我们来练习上面的知识:
加入你想在浏览器中显示下面的效果的(我的网络不是很好,插入代码很慢,所以是手写的,大家见谅):
<?xml version="1.0"?>
<person>
<name>xiao&yang</name>
<age><30</age>
<address>"wuhan"</address>
</person>
那么你的xml文档就如下编写:
<?xml version="1.0"?>
<person>
<name>xiao&yang</name>
<age><30</age>
<address>"wuhan">"</address>
</person>
当然,那些实体是已经定义好了的,我们也可以定义自己的实体引用,称为通用实体.在DTD中,可以将实体定义为:
<! ENTITY personal "this is my person identify ">
然后你就可以在你的xml文档中引用自己定义的实体引用:
<person>
<mypersonal>&personal </mypersonal>
</person>
用浏览器看就是如下:
<person>
<mypersonal>this is my person identify </mypersonal>
</person>