一、文档规则 1、区分大小写。 2、属性值必须加引号(单引号、双引号都可以),一般情况下建议使用使用双引号。 3、所有标记必须有结束符号。 4、所有空标记必须关闭。 5、必须有且仅有一根元素。 6、解析空白字符时,会按照实际内容输出,不会缩略。 7、特殊字符处理: 字符 替换字符 < < > > & & " &quto; ' ' 8、标记名称约定: [1] 可以包含字母、数字、其他字符。 [2]不能以数字和下划线开头。 [3]不能以xml或者Xml之类的字符开头。 [4]不能包含空格 二、xml声明 xml声明标准语句:<?xml version="1.0" encoding="GB2312" standalone="yes"?> 强调: 1、“<?xml” 中的"<?"和"xml"中间不能有空格。 2、”?>"之前可以有空格,也可以没有。 3、enconding和standalone是可选属性,encoding默认值是"UTF-8",standalone默认值是"no"。 4、常见的编码方式有: 简体中文:GB2312 繁体中文 :BIG5 西欧字符:UTF-8,UTF-16 5、standalone表示文档是否附带DTD文件。 三、xml属性 因为数据既可以存储在子元素中也可以存储在属性中,那么何时用属性,何时用子元素,没有固定规则,但是建议:元数据应该以属性的方式存储,而数据本身应该以元素的形式存储。 使用属性会引发以下问题: 1、属性不能包含多个值(子元素可以)。 2、属性不容易扩展。 3、属性不能描述结构(子元素可以)。 4、属性很难通过DTD进行测试。 四、命名空间 声明命名空间俩种方式: 1、默认声明,所有元素不需要指定前缀,如: <schema xmlns="http://www.w3.org/2001/XMLschema"> <element name="diguonianzhu" type="string"/> …… </schema> 2、明确声明,xmlns关键字与一个命名空间的URI的前缀相关联,所有元素都需要指定前缀,如: <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLschema"> <xsd:element name="diguonianzhu" type="string"/> …… <xsd:/schema> 强调:用来表示命名空间的URI并不被XML解析器调用,实际上并不去访问这个URI,它只是表示一个标识名字而已。 五、XML专用标记:CDATA CDATA的全称是Character DATA,即字符数据,它主要用来显示特殊字符,比如"<"。 CDATA的语法格式为: <![CDATA[要显示的字符]]> 如: <?xml version="1.0"?> <data> <![CDATA[ <ok alma!> by a&b! ]]> </data> 强调:CDATA不能嵌套;要显示的字符中不能包含"]]>"。