XML语言学习随笔
XML和HTML都是W3C的定制的标准,XML的诞生本身是为了替代不成熟的HTML,但是因为现实的环境,XML替代HTML并未成功。之后W3C为了代码严谨性的决心,又发布了升级版的标记语言XHTML,但是依然因为显示环境的主要原因,未能成功推广,知道今天HTML5的诞生!
XML简单的特点
1. 比HTML更加规范严谨
2.具备树状格式
3.具有层次感
XML的组成
1.文档声明
2.元素
3.属性
4.注释
5.CDATA区
6.特殊字符
7.处理命令
文档声明
在XML中必须存在文档声明,否则绝对是一个不规范的XML,写法:<? xml version="1.0" encoding="utf-8" standalone="yes" ?><xml>
属性 version 表示版本号 附:因为XML并未推广成功,所以XML目前只有1.0版本
属性 encoding 文本编码
属性 standalone 独立运行 附:日常中几乎这个属性不怎么出现
关于文本编码声明说明:
日常生活中,我们写完XML代码然后保存XML格式文件到硬盘需要转换到二进制,当文本转到二进制后,如果放在服务器,有客户这是访问了这个文档,那么此时服务器就会发生二进制给对方,对方收到后,为了还原,所以浏览器会自动解码成能够看懂的编码,而在中国浏览器使用的是GBK编码,而编辑XML的工具保存XML的时候,通常是UTF-8编码,为了使客户获取文本后,能够看到正确的内容,此时我们就需要在文档中声明 编码格式为 encoding=”UTF-8“ 那么在对方浏览器解析二进制后,就会自动转换成UTF-8而不是转换为GBK编码的乱码形式显示。
元素(标记/标签)
1.标签不像HTML 中可以有<br/>这种形式存在,XML是规范严谨的 所以有开始标签,必须有结束标签
2.标签和HTML一样,不支持交叉嵌套
3.一个合理的XML文档,整篇只会存在一个根元素,充分体现树状形式
4.对于XML而言 空格和换行符都会当作内容处理,所以严谨的XML文档请勿如同平时HTML一样随意打上空格和换行符!
5.XML是区分大小写的,所以请确保大小写不规范
属性
1. 一个标签可以有多个属性,就如同声明标签<XML></XML>一样里面可以放版本,编码等属性
2. 属性的值根据XML的规范需要打上双引号
CDATA
在日常中,就如同我现在写笔记,不妨会出现<> [] 此类特殊字符,而XML中<>是具备特殊含义的。一般我们可以用转义字符方式显示,但是如果内容特别多,这样比较麻烦,所以XML特别提供了CDATA分区。
我们只要将内容前后输入<![CDATA[ code ]]> 标签,然后在code区输入自己需要写的内容,那么XML就不会将此区域里的特殊字符<>此类当作标签定义,而是正常的文本!
浏览器解析的三个方式 附: 解析就是为了对HTML或XML动态的可以改变文档的内容,以及可以结构化的查询某个标签的具体内容 属性等。
DOM解析:将所有的标签都转换为对象,存放在内存中,这样资源可以随意调用修改,但是因为在内存所以特别占用资源
SAX解析:这种解析方式会逐行地去扫描XML文档,当遇到标签时会触发解析处理器,采用事件处理的方式解析XML (Simple API for XML) ,不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。优点是:在读取文档的同时即可对XML进行处理,不必等到文档加载结束,相对快捷。不需要加载进内存,因此不存在占用内存的问题,可以解析超大XML。缺点是:只能用来读取XML中数据,无法进行增删改,以及触发后则全篇解析。
Pull解析: 这种方式是sax解析的改版,安卓通常采用的方式, 同样采用事件触发解析,但是不需要扫描整个文件流,找到需要的那部分,就解析那部分,避免了SAX解析方式,只要触发则全篇解析,所以比sax解析更简单和对内存占用更小!
关于老师讲的学习这些知识:我们学习,是否需要掌握到全部的具体精细到点内容的问题。这是不必要的,我们只要能大概知道这部分知识,以后能在开发中遇到问题时,大概知道是哪方面的,在着重学习其核心知识,能事半功倍,如果现在连运用场合都不知道,盲目去直接跟着视频学习到具体核心技术点的那些复杂直视,按照通常人的大脑会把没用的都淘汰掉,估计学完也就忘完了!
人脑是奇妙的,如果你不告诉他这种知识能够做什么,就会很快遗忘。如果你不知道学习这篇内容的学习目的,那么一样会学得多忘得多!