【9-7】XML学习笔记01
Tips
-
XML标签大小写敏感;
-
XML文件一般使用国际化通用的编码“utf-8”,所以平时看到的XML文件的头部都会有这样的代码:
<?xml version="1.0" encoding="utf-8"?>
当XML文件中有中文时,必须使用encoding属性指明文档的字符编码,例如:encoding="GB2312"或者encoding="utf-8",并且在保存文件时,也要以相应的文件编码来保存,否则在使用浏览器解析XML文件时,就会出现解析错误的情况。
- XML声明语句有standalone属性:
- 该属性定义了是否可以在不读取任何其他文件的情况下处理该文档,其属性值可以是yes或no,如果XML文档没有引用任何其他文件,则可以指定standalone=”yes”,否则standalone=”no”。 standalone默认值是no。
-
格式良好的XML文档必须有且仅有一个根标签,其它标签都是这个根标签的子孙标签。对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。
-
一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:
- 区分大小写,例如,<P>和<p>是两个不同的标记。
- 不能以数字或"_" (下划线)开头。
- 不能以xml(或XML、或Xml 等)开头。
- 不能包含空格。
- 名称中间不能包含冒号(:)
- Xml文件中的注释采用: <!--注释--> 格式。XML声明之前不能有注释,注释不能嵌套;
- 字符引用:实际处理过程中,不在键盘上的字符或是图形字符是无法直接输入的,这种情况下,可以使用Unicode码将它们以字符引用的形式加入。
<![CDATA[不需解析的内容]]>特殊标签
- CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data);
-
在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理,遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出。
实体引用(entity reference)
-
避免把字符数据和标签中需要用到的一些特殊字符相混淆;
- <:<
- >:>
- &:&
- ':'
- ":"
处理指令
- 处理指令,简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容,标签名为中文时,css不起作用。
- <?xml-stylesheet type="text/css" href="css文件名.css"?>
- 处理指令必须以"<?"作为开头,以"?>"作为结尾,XML声明语句(<?xml version="1.0" encoding="utf-8"?>)就是最常见的一种处理指令。
- <?xml version="1.0" encoding="utf-8"?>
- xls文件:XSL是可扩展样式表语言的外语缩写,是一种用于以可读格式呈现 XML(标准通用标记语言的子集)数据的语言。eXtensible Stylesheet Language
- <?xml-stylesheet type='text/xsl' href='xxx.xsl'?>