XML学习总结

开篇:
经过了几天自学,终于把XML学完了。这里把学习的成果总结一下。如果有什么不对请留言指出,因为我们都在错误中长大。

 

适合人群:
我写的这篇博客适合那些不是很懂或者是完全没有接触过xml的博友们。

 

环境:
我学习的环境要交代一下的:
操作系统:win7旗舰版 64位
服务器IIS 7.5
浏览器:IE9
开发工具:Notepad++

 

XML简介:
好了可以开始正式的学习了,在以前看一本计算机书籍,一般第一章都是这个语言的简介,觉得那些都是废话。后来才发现,在学习任何一门语言之前,还是有必要简单的介绍一下这门语言的,因为他告诉了我们为什么会有这门语言,并且这门语言存在的意思。如果没有任何意思的语言我想没有任何人会去学习他。

XML中文名称:可扩展标记语言;英文名称:extensible markup language;用于标记电子文件使其具有结构性的标记语言。XML可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。(来自百度百科)

 

XML与数据库、html区别

XML与Access,OracleSQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,XML仅仅是存储数据。事实上XML与其他数据表现形式最大的不同是:他极其简单。这是一个看上去有点琐细的优点,但正是这点使XML与众不同。

XML与HTML的设计区别是:XML是用来存储数据的,其焦点是数据的内容。而HTML 被设计用来显示数据,其焦点是数据的外观。

XML和HTML语法区别:HTML的标记不是所有的都需要成对出现,XML则要求所有的标记必须成对出现;HTML标记不区分大小写,XML则相反。(来自百度百科)


XML正式学习

上面都是比较抽象的概念,但是也是最权威的解释了。但是这里我想用我自己的话讲XML就是一种可以扩看的标记性语言,他和HTML不同的是HTML当中对关键字如html table都已经定死了,我们无法改变其意思,而xml那些关键字都是我们人为的定义在使用。xml其实说白了就是用来保存数据的,比如说你的配置文件数据,还有一写数据非常的少,要是放在数据库觉得浪费,但是又不得不考虑的那些数据放在xml文件中是最好的了。xml语法和html语言很接近,如果我们有一个头,就必须也要有一个界面,如:<div></div>。其次我们的跟元素就只有一个,例如html语言中,我们只有一个跟的<html></html>根元素。下面我们用代码说明我们的一切吧。

View Code
 1 //定义xml的版本及浏览器显示的字符语言格式utf-8
 2 <?xml version="1.0" encoding="utf-8"?>
 3 
 4 <class>
 5     <stu>
 6         <name>Jimmy</name>
 7         <sex>man</sex>
 8         <age>19</age>
 9     </stu>
10     
11     <stu>
12         <name>Tommy</name>
13         <sex>women</sex>
14         <age>20</age>
15     </stu>
16     
17     <stu>
18         <name>Ketty</name>
19         <sex>women</sex>
20         <age>21</age>
21     </stu>
22 </class>

写好了代码我们用浏览器查看一下吧,右击你的xml文件打开方式选择IE浏览器。看看效果图吧:

其中最第一行为定义xml的版本及浏览器显示的语言格式。

 

这是一个对的语言,如果我们把去掉其中的一个界面标志,那就会报错(这里去掉第三个</age>标志),


这里好像ie9 测试不出来,用的是遨游测试的。如果我们不成对的标志写,那就会报错。

学到这里你已经把xml基本的语法学习好了。你已经是初学者了。下面的提上篇。

 

提升篇

其实xml也可以嵌入css文件的,接下在我将陷入一个css文件,让你的对xml文件有另一番领悟。

代码:

View Code
 1 <?xml version="1.0" encoding="utf-8"?>
 2 
 3 <!--引用css样式文件-->
 4 <?xml-stylesheet type="text/css" href="css.css"?>
 5 <class>
 6     <stu>
 7         <name>Jimmy</name>
 8         <sex>man</sex>
 9         <age>19</age>
10     </stu>
11     
12     <stu>
13         <name>Tommy</name>
14         <sex>women</sex>
15         <age>20</age>
16     </stu>
17     
18     <stu>
19         <name>Ketty</name>
20         <sex>women</sex>
21         <age>21
22     </stu>
23 </class>

显示效果为:



接着我们在来讲一下dtd的文件。

不知道你们发现没有,网页的前面几行都有这么一行<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

其实这个就是对dtd文件,那dtd文件有什么用处呢?
dtd定义:文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。

说白了dtd就是定义你的xml文件中可以有哪些元素,不可以有哪些元素,这些元素可以的值是什么类型的。但是我们直接查看xml文件他并不会报错,需要禁用js创建一个ActiveXObject对象,才可以对其进行校验。

好了我们来开始dtd文档的总结吧。
从代码开始Checkdtd.htm文件(检测xml是否规范)代码:

View Code
<html>
    <head>
        <title>测试dtd文档</title>
        <meta http-equiv="content-type" content="text/html;charset=gb2312" />
        <script type="text/javascript">
        <!--
            //创建一个xml解析器
            var xmldoc=new ActiveXObject("Microsoft.XMLDOM");
            
            //开启校验功能
            xmldoc.validateOnParse=true;
            
            //指定对那个xml文件校验
            xmldoc.load("myblog.xml");
            
            //显示错误的信息
            document.write("错误信息="+xmldoc.parseError.reason+"<br />");
            document.write("错误的行号"+xmldoc.parseError.line+"<br />");
        -->
        </script>
    </head>
    
    <body>
    </body>
</html>

需要检测的xml文件(myblog.xml)

View Code
 1 <?xml version="1.0" encoding="utf-8"?>
 2 
 3 <!--加载dtd文件-->
 4 <!DOCTYPE class SYSTEM "mydtd.dtd">
 5 <class>
 6     <stu>
 7         <name>Jimmy</name>
 8         <sex>man</sex>
 9         <age>19</age>
10     </stu>
11     
12     <stu>
13         <name>Tommy</name>
14         <sex>women</sex>
15         <age>20</age>
16     </stu>
17     
18     <stu>
19         <name>Ketty</name>
20         <sex>women</sex>
21         <age>21
22     </stu>
23 </class>

定义规范的dtd文件(mydtd.dtd)

View Code
1 <!ELEMENT class (stu+)>
2 <!ELEMENT stu (name,sex,age)>
3 <!ELEMENT name (#PCDATA)>
4 <!ELEMENT sex (#PCDATA)>
5 <!ELEMENT age (#PCDATA)>

我们从htm代码开始讲吧,学过c++、java、.net的人知道New一个类是在创建一个对象,这里第一句话的意思就是创建一个检测xml文件的对象,并命名为xmldoc变量,然后我们开启了检验的功能,在然后我们确定需要校验的xml文件,如果不在同一个目录下可以用相对路径或者绝对路径的方法找到xml文件。如果有错误那我们则把错误找出并现在在页面上。

接着我们看看xml文件吧
别的地方就不讲了,其中有句话是加载dtd的文件:<!DOCTYPE class SYSTEM "mydtd.dtd">
其中定义的格式规范为

<!DCTYPE 根元素名 SYSTEM "写dtd的路径">
<!DCTYPE 根元素名 [dtd元素内容]>

因为我们这里的跟元素是class 且mydtd.dtd和myblog是同一个目录所以最后为<!DOCTYPE class SYSTEM "mydtd.dtd">

最后我们来分析一下mydtd.dtd文件

元素的定义格式为:

<!ELEMENT 元素名称 (元素内容)>
如果是空元素则可以这样定义:
<!ELEMENT 元素名称 EMPTY>

这里我们看到在根元素下面有很多的stu元素,所以<!ELEMENT class (stu+)>

其中+的意思stu这个元素的个数为1到n
如果是*则stu的元素的个数为0到n

其他具体的修饰符这里就不列举了,感兴趣的话去官网查一下。

接着我们看到stu元素下面有name、sex、age 3个元素所以我们定义<!ELEMENT stu (name,sex,age)>

如果你去掉其中一个stu下面的一个age则用Checkdtd.htm会提示错误。这里就不测试了。

最后一句的意思是<!ELEMENT name (#PCDATA)>定义name这个元素的的数据类型可以为字符串。

 

学习总结,这些是本人对xml的学习的总结,希望对你又帮助 ,如果有什么不对的地方 请指出!

 

posted @ 2012-06-18 23:33  唯吴独尊  阅读(8493)  评论(2编辑  收藏  举报