与HTML不同的是XML是包括元素和标记属性。
1,字符
由于XML是要在全球范围内使用的,所以使用在16位Unicode字符集中定义的大多数字符。有两种Unicode格式用做XML字符的基础:UTF-8和UTF-16 。UTF-8和UTF-16 要求被所有的XML处理器支持。
UTF-8在北美和欧洲流行,因为开始的128个字符直接映射到7位US-ASCII。UTF-8是多字节编码,字符值用1至6字节表示。
UTF-16编码方式为字符使用16位值,共有65536种可能位值。
合法的XML字符(09,0A,0D),包括三个ASCII控制符,所有普通的ASCII可显示字符以及几乎所有的其他Unicode字符值。
特殊的XML字符(< > & ' " ),由于这些字符用于界定标记和字符串,它们通常不出现在正规的文本数据中,因此这些字符在实体引用上有另一种方式。
< -> <
> -> >
& -> &
' -> '
" -> "
2,命名
首字母:任何Unicode字符,_(下划线),:(冒号)。
其他字符:任何Unicod字符,任何Unicode数字,_(下划线),:(冒号),-(连字符),.(句号,终止符)。
![](https://img2024.cnblogs.com/blog/35695/202407/35695-20240713070336838-1837943664.jpg)