区分XML中CDATA和#PCDATA

在XML文档中，能看到“CDATA"的地方有三处：

1）在DTD中，指定标签中某个属性的类型为字符型时，使用CDATA。因为XML解析器回去分析这段字符内容，因而里面如果需要使用>, <, &, ', "这5个特殊字符，应当用对应的替代替代字符来表示(必须以&开始，以;结束)。具体如下：
< - < (less than)
> - > (greater than)
& - & (ampersand)
' - ' (apostrophe)
" - " (straight double quotation mark)

例如在DTD中声明：
    <!ATTLIST author period CDATA> 它表示在author这个标签中，period属性应该是字符类型。

2) 在XML中，指定某段内容不必被XML解析器解析时，使用<![CDATA[...]]>。也就是说中括号中的内容解析器不会去分析。所以其中可以包含>, <, &, ', "这5个特殊字符。经常把一段程序代码嵌入到<![DATA[...]]>中。因为代码中可能包含大量的 >, <, &, "这样的特殊字符。

例如在XML中声明：
    <![CDATA[
        if(i<10){
          System.out.println("i<10");
        }
    ]]>

3) 在DTD中，指定某个标签中的内容是字符数据时，使用(#PCDATA)。由于它的内容也是需要解析器来解析的，所有仍然需要转换>, <, &, ', "这5个特殊字符。

例如在DTD中声明：
    <!ELEMENT name (#PCDATA)> 它表示在<name>和</name>标签之间可以插入字符或者子标签。

#PCDATA是要给XML解析的数据，如 > 要写成 >才不会出错。
CDATA区域表示里面是什么数据XML不会解析。

【XML中CDATA与#PCDATA与PACATA的区别】

1. CDATA: Character Data, PCDATA: Parsable

CDATA，是可以分析的字符序列，CDATA就是指字符串，而PCDATA可以是字符串、子元素、字符串和子元素。　　

2. CDATA是属性声明中的类型，就是字符串，&、<、“”和‘’ 等都具有特殊含义被解析，例如："解析为双引号；#PCDATA是元素声明中的类型，指的是混合类型，即可以包子元素也可包含字符串， &和<也是具有特殊含义被解析。　

ANY 并不局限于“#PCDATA”，只是说明该元素可以包含任何内容，一般来讲，解析器无法验证其有效性（一般也不会验证），#PCDATA源于“可解析的字符”，对于有特殊含于的< 会按照子元素开始进行解析。

#PCDATA    该内容模型说明元素中可以同时出现文本和元素.
ANY           ANY关键子表明DTD中声明的任何元素都可以使用作该元素的子元素
CDATA       属性值是字符数据

#PCDATA和ANY用于元素声明
CDATA用于属性声明

posted @ 2017-09-25 22:36 鱼笑笑阅读(1886) 评论(0) 编辑收藏举报

刷新页面返回顶部

鱼笑笑

区分XML中CDATA和#PCDATA

公告