XML的相关基础知识分享(一)
XML和Json是两种最常用的在网络中数据传输的数据序列化格式,随着时代的变迁,XML序列化用于网络传输也逐渐被Json取代,前几天,单位系统集成开发对接接口时,发现大部分都用的WebService技术,而数据传输序列化都是XML,所以想在此重温一下关于XML的相关知识。
一、什么是XML
1、XML是可扩展标记语言
2、XML宗旨是传输数据,而非显示数据
3、XML没有预定义标签,都需要自行定义标签
4、XML不会做任何事情,他设计出来就是为了结构化、储存和传输信息用的
5、XML是纯文本,有能力处理纯文本的软件,都可以处理XML
二、XML结构
首先我们来看一个简单的XML示例
1 <?xml version="1.0" encoding="ISO-8859-1"?> 2 <note> 3 <to>小魔王</to> 4 <from>女神</from> 5 <heading>表白</heading> 6 <body>我喜欢你好久了</body> 7 </note>
第一行是XML声明,他定义XML的版本(1.0)和所使用的编码(ISO-8859-1 = Latin-1/西欧字符集)。
下一行描述文档的根元素<note>
接下来的4行描述根元素的4个子元素 to、from、heading、body
最后一行定义根元素的结尾
看上面的结构,我们可以设想一下:这个XML文档包含了 女神 给 小魔王 表白的信息。
这样看来,XML具有出色的自我描述性,同意吗?
三、注意点:
1、XML文档必须包含根元素,该元素是所有其他元素的父元素
2、XML文档中的元素形成了以可文档树,这棵树从根部开始,并扩展到树的最低端,所有元素均可拥有子元素
3、父、子以及同胞等术语用于描述元素之前的关系,父元元素拥有子元素,相同层级上的子元素成为同胞(兄弟或姐妹)
下面我们来个示例:
1 <?xml version="1.0" encoding="ISO-8859-1"?> 2 <bookstore> 3 <book category="COOKING"> 4 <title lang="en">Everyday Italian</title> 5 <author>Giada De Laurentiis</author> 6 <year>2005</year> 7 <price>30.00</price> 8 </book> 9 <book category="CHILDREN"> 10 <title lang="en">Harry Potter</title> 11 <author>J K. Rowling</author> 12 <year>2005</year> 13 <price>29.99</price> 14 </book> 15 <book category="WEB"> 16 <title lang="en">Learning XML</title> 17 <author>Erik T. Ray</author> 18 <year>2003</year> 19 <price>39.95</price> 20 </book> 21 </bookstore>
示例图解:
例子中的根元素是<bookstore>,文档中的所有<book>元素有被包含在<bookstore>中。
<book>元素有4个子元素:<title>、<author>、<year>、<price>
4、所有元素均可拥有文本内容和属性(类似HTML中)
5、所有XML元素又必须有关闭标签(注:XML声明没有关闭标签这不是错误,声明不属于XML本身的组成部分,他不是XML元素,也不需要关闭标签)
6、XML标签对大小写敏感,即<Letter>与<letter>是两个不同的标签
7、XML的属性值必须加引号(无论数字还是非数字)。
8、XML中,空格会被保留(与HTML不同)
四、实体引用
在XML中,一些字符拥有特殊的意义。
比如”<“ ,如果你将字符”<“放到XML元素中,会发生错误,这是一因为解析器会把它当作新元素的开始,例如:
<age>19<20</age>
为了避免这个错误,请用实体引用来代替”<“字符:
<age>19<20</age>
在XML中,有5个预定义的实体引用,如下:
注:在XML中,只有字符”<“,”&“ 是非法的,">"是合法的,但是用实体引用来代替它是一个好习惯。
XML还有一些高级的用法,比如命名空间、CDATA 等等,我们将会在下次进行分享~