XML:可扩展的标记语言。以标记和子标记方式描述对象数据。
一个xml中必须有一个声明:
xml中注释使用
xml根元素:每个xml文档必须有且只有一个根元素,根元素时一个完全包括文档中其他所有元素的元素,所有的元素都必须在根元素中定义
xml中定义的符号如:“<”,""",">"需要用预定义的实体来代替
"<":<
">":>
"&":&
""":"
"'":'

CDATA是不被解析器解析的文本。文本内的标签不会被当作标记,实体不会被展开。
语法:

可以输入任何字符(除了]]>外),不能嵌套

XML文档必须是格式良好的。满足XML基本的语法规则,称为格式良好的XML文档。

语法规则:
必须有XML声明语句
必须有且仅有一个根元素
标记大小写敏感
属性值用引号
标记成对
空标记关闭
元素正确嵌套

文档描述与校验技术:DTD和Schema都是用于定义XML结构,并且用于校验我们书写的XML文档是否符合要求的技术。

有效的XML是指除了要满足XML规范外,还要满足相应DTD和Schema定义的元素规则。
有效的XML一定是格式良好的,但是格式良好的XML不一定是有效的

DOM解析
基于树状结构的API
整个XML文档必须在内存中解析和存储
客户端应用程序就可以随机访问这些对象。
大型文档则会造成内存紧张

SAX解析
不必将整个文件加载到内存中,占用的内存少
不能对文档进行随机访问
SAX是只读的
文档只能遍历一次