XML基础

一个xml文档只能有一个根元素

XML文档声明:

  <?xml  version="1.0"  encode="utf-8"  standalone="no"?>

  • version代表xml版本,是必须声明的属性
  • encode声明当前文档的字符编码集,xml解析器会使用这个编码来解析xml文档,默认为utf-8
  • standalone代表文件是否独立(有没有约束),no代表依赖外部的约束文件,默认值是yes

  最简单的xml文档声明:<?xml version="1.0"?>

 

元素标签命名规范:

  xml元素可以包含字母、数字和可见字符,但要遵循以下规范:

  • 区分大小写
  • 不能以数字开头
  • 最好不要以xml开头
  • 不能包含空格

 

元素属性:

  • 属性由属性名和属性值构成,中间用等号连接
  • 属性值必须用单或双引号括起来
  • 属性与元素标签的命名规范相同
  • 属性必须定义在元素的开始标签中
  • 不能包含相同的属性名

 

xml注释格式:<!--    -->

 

转义字符

转义字符以&开头  ;结尾,这个特点与实体相同

&     &amp;       
<      &lt;       
>      &gt;       
"      &quot;     
'       &apos;
[/size]

 

PCDATA

PCDATA 指的是被解析的字符数据(Parsed Character Data)。

XML 解析器通常会解析 XML 文档中所有的文本。

当某个 XML 元素被解析时,其标签之间的文本也会被解析:

<message>此文本也会被解析</message>

解析器之所以这么做是因为 XML 元素可包含其他元素

 

CDATA

所有 XML 文档中的文本均会被解析器解析。

只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。

CDATA 格式:   <![CDATA[      内容部分      "]]>"

posted @ 2017-07-13 11:43  邀魂斩月  阅读(163)  评论(0编辑  收藏  举报