代码改变世界

xml相关知识

2018-03-18 13:22  廖向乾  阅读(193)  评论(0编辑  收藏  举报

xml定义:XML ( Extensible Markup Language ,扩展标志语言) 是一种标准通用标记语言 ,即 SGML 的一个子集. 它定义了一套语义标记的规则 ,这些标记将文档分成许多部件并对这些部件定义为标签. XML 与 HTML 的最大不同就是用户根据定义出来的标签 ,可以按照实际的需要对需要传送的文件进行充分的表达。

xml用途:xml可以用来标记数据、定义数据类型、丰富文件、解释数据等,适合万维网的传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。它是依赖于内容的技术,是当前处理结构化文档信息的有力工具。

xml工作原理:

xml未来发展过程:

● 异构数据源的集成。XML数据库对多数据源的集成,是对XML技术可扩展性这一长处的极好发挥。但是,就目前的集成程度和在应用层上所提供的功能来看还是远远不够的。如何从对数据的集成过渡到对系统的集成,从而在远景目标上实现类似于网格计算(grid computing)概念的系统,恐怕是XML数据库工作者的核心任务之一。

● 底层索引结构。目前的商用XML数据库系统优于实验室原型系统的特点之一就是其底层的索引结构。但是,现有的商用XML数据库的底层索引结构一般都是B+树。虽然B+树索引是一种成熟的索引结构,但是,研究结果显示,在XML数据库中,它的性能表现并不是最好的。学术界已经开发出了若干种适用于XML数据的索引结构,如XR树、XB树等,需要XML数据库工作者来进一步关注。

● 并发加锁协议。在现有的XML数据库系统中,加锁的粒度是整个文档,事务并发的层次也在文档一级。随着应用级文档的日益增大,这个粒度在一定程度上将会成为系统效率的瓶颈。如何通过边锁(edge lock)机制来实现元素节点级粒度的加锁?这一工作现在吸引了不少研究者的目光,而且,上述的锁协议是在逻辑层,如何将它映射到底层的B+树索引(或者XR树索引)上,也是必须要做的一件事情。

● XML模式规范化是一个值得关注的方向。一旦取得突破,将会使我们可以像在关系库中那样方便地设计XML数据库的结构,消除数据的冗余和不一致现象。目前,这一领域已经成为学术界关注的热点。但是,完整的、为业界所公认的理论体系尚未建立。

摘自:http://lxdzxn.blog.sohu.com/107406235.html