XML语言学习随笔

XML和HTML都是W3C的定制的标准，XML的诞生本身是为了替代不成熟的HTML，但是因为现实的环境，XML替代HTML并未成功。之后W3C为了代码严谨性的决心，又发布了升级版的标记语言XHTML，但是依然因为显示环境的主要原因，未能成功推广，知道今天HTML5的诞生！

XML简单的特点

1. 比HTML更加规范严谨

2.具备树状格式

3.具有层次感

XML的组成

1.文档声明

2.元素

3.属性

4.注释

5.CDATA区

6.特殊字符

7.处理命令

文档声明

在XML中必须存在文档声明，否则绝对是一个不规范的XML，写法：<? xml version="1.0" encoding="utf-8" standalone="yes" ?><xml>

属性 version 表示版本号附：因为XML并未推广成功，所以XML目前只有1.0版本

属性 encoding 文本编码

属性 standalone 独立运行附：日常中几乎这个属性不怎么出现

关于文本编码声明说明：

日常生活中，我们写完XML代码然后保存XML格式文件到硬盘需要转换到二进制，当文本转到二进制后，如果放在服务器，有客户这是访问了这个文档，那么此时服务器就会发生二进制给对方，对方收到后，为了还原，所以浏览器会自动解码成能够看懂的编码，而在中国浏览器使用的是GBK编码，而编辑XML的工具保存XML的时候，通常是UTF-8编码，为了使客户获取文本后，能够看到正确的内容，此时我们就需要在文档中声明编码格式为 encoding=”UTF-8“ 那么在对方浏览器解析二进制后，就会自动转换成UTF-8而不是转换为GBK编码的乱码形式显示。

元素(标记/标签)

1.标签不像HTML 中可以有<br/>这种形式存在，XML是规范严谨的所以有开始标签，必须有结束标签

2.标签和HTML一样，不支持交叉嵌套

3.一个合理的XML文档，整篇只会存在一个根元素，充分体现树状形式

4.对于XML而言空格和换行符都会当作内容处理，所以严谨的XML文档请勿如同平时HTML一样随意打上空格和换行符！

5.XML是区分大小写的，所以请确保大小写不规范

属性

1. 一个标签可以有多个属性，就如同声明标签<XML></XML>一样里面可以放版本，编码等属性

2. 属性的值根据XML的规范需要打上双引号

CDATA

在日常中，就如同我现在写笔记，不妨会出现<> [] 此类特殊字符，而XML中<>是具备特殊含义的。一般我们可以用转义字符方式显示，但是如果内容特别多，这样比较麻烦，所以XML特别提供了CDATA分区。

我们只要将内容前后输入<![CDATA[ code ]]> 标签，然后在code区输入自己需要写的内容，那么XML就不会将此区域里的特殊字符<>此类当作标签定义，而是正常的文本！

浏览器解析的三个方式附：解析就是为了对HTML或XML动态的可以改变文档的内容，以及可以结构化的查询某个标签的具体内容属性等。

DOM解析：将所有的标签都转换为对象，存放在内存中，这样资源可以随意调用修改，但是因为在内存所以特别占用资源

SAX解析：这种解析方式会逐行地去扫描XML文档，当遇到标签时会触发解析处理器，采用事件处理的方式解析XML (Simple API for XML) ，不是官方标准，但它是 XML 社区事实上的标准，几乎所有的 XML 解析器都支持它。优点是：在读取文档的同时即可对XML进行处理，不必等到文档加载结束，相对快捷。不需要加载进内存，因此不存在占用内存的问题，可以解析超大XML。缺点是：只能用来读取XML中数据，无法进行增删改，以及触发后则全篇解析。

Pull解析：这种方式是sax解析的改版，安卓通常采用的方式，同样采用事件触发解析，但是不需要扫描整个文件流，找到需要的那部分，就解析那部分，避免了SAX解析方式，只要触发则全篇解析，所以比sax解析更简单和对内存占用更小！

关于老师讲的学习这些知识：我们学习，是否需要掌握到全部的具体精细到点内容的问题。这是不必要的，我们只要能大概知道这部分知识，以后能在开发中遇到问题时，大概知道是哪方面的，在着重学习其核心知识，能事半功倍，如果现在连运用场合都不知道，盲目去直接跟着视频学习到具体核心技术点的那些复杂直视，按照通常人的大脑会把没用的都淘汰掉，估计学完也就忘完了！

人脑是奇妙的，如果你不告诉他这种知识能够做什么，就会很快遗忘。如果你不知道学习这篇内容的学习目的，那么一样会学得多忘得多!

posted @ 2017-04-29 22:40 睡觉第一名阅读(366) 评论(1) 编辑收藏举报

刷新页面返回顶部

XML语言学习随笔

公告