dom4j解析XML文件(1)—XML文件的基本常识

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <list>
 3     <emp id="1">
 4         <name>张三</name>
 5         <age>34</age>
 6         <gender></gender>
 7         <salary>3000</salary>
 8     </emp>
 9     <emp id="2">
10         <name>李四</name>
11         <age>21</age>
12         <gender></gender>
13         <salary>4000</salary>
14     </emp>
15     <emp id="3">
16         <name>王五</name>
17         <age>46</age>
18         <gender></gender>
19         <salary>6500</salary>
20     </emp>
21     <emp id="4">
22         <name>赵六</name>
23         <age>28</age>
24         <gender></gender>
25         <salary>4400</salary>
26     </emp>        
27     <emp id="5">
28         <name>钱七</name>
29         <age>53</age>
30         <gender></gender>
31         <salary>12000</salary>
32     </emp>    
33 </list>

1.XML处理指令

  XML处理指令,简称PI(processing instruction)。

  处理指令是用来指挥解析引擎如何解析XML文档内容。

  例如:<?xml version="1.0" encoding="UTF-8"?>

2.元素和属性

  元素是从开始标签到结束标签的部分。元素可以包括其他元素、文本、或者两者的混合物。元素可以拥有属性。

  元素可以在开始标签中包括属性,属性(Attribute)提供关于元素的额外(附加)的信息。属性通常提供不属于数据组成部分的信息,但是对需要处理这个元素的应用程序来说很重要。

  元素必须加引号,双引号和单引号都可以。例如:<emp id="1">

3.实体引用

  实体引用可以是常用的短语,键盘字符,文件,数据库记录或者任何包含数据的项。在XML中,有时实体内包含一些字符,这些字符需要转移,见下面的对应关系。

  &lt;  <(小于)

  &gt;  >(大于)

  &amp;  &(与字符)

  &apos;  '(单引号)

  &quot;  "(双引号)

4.CDATA段

  格式:<![CDATA[文本内容]]>

  

posted @ 2014-10-21 18:56  迷音  阅读(191)  评论(0编辑  收藏  举报