XML聚合格式 ATOM
Atom是一对彼此相关的标准。Atom供稿格式(Atom Syndication Format)是用于网站消息来源,基与XML的文档格式;而Atom出版协定(Atom Publishing Protocol,简称AtomPub或APP)是用于新增及修改网络资源,基于HTTP的协议。它被站点和客户工具等用来聚合网络内容,包括weblog和新闻标题等,它借鉴了各种版本RSS的使用经验。
Atom是IETF的“建议标准”,Atom供稿格式列为 RFC 4287,而Atom出版协定列为 RFC 5023。
Atom与RSS 2.0的比较
当初发展Atom的动机在于广泛应用RSS 2.0时所遇到的问题。为了降低开发支持Web聚合应用的难度,下面列出Atom 1.0所克服的RSS 2.0几个主要问题:
1、RSS 2.0 可能包含文本或经过编码的HTML内容,同时却没有提供明确的区分办法;相比之下,Atom 则提供了明确的标签(也就是typed)。
2、RSS 2.0 的 description 标签可以包含全文或摘要(尽管该标签的英文含义为描述或摘要)。Atom 则分别提供了 summary 和 content标签,用以区分摘要和内容,同时Atom 允许在summary中添加非文本内容。
3、RSS 2.0 存在多种非标准形式的应用,而 Atom 具有统一的标准,这便于内容的聚合和发现。
4、 Atom 有符合XML标准的命名空间,RSS 2.0 却没有。
5、Atom 通过XML内置的xml:base标签来指示相对地址(URI),RSS 2.0 则无相应的机制区分相对地址和绝对地址。
6、Atom 通过XML内置的xml:lang,而 RSS 采用自己的language标签。
7、Atom 强制为每个条目设定唯一的ID,这将便于内容的跟踪和更新。
8、Atom 1.0 允许条目单独成为文档,RSS 2.0 则只支持完整的种子文档,这可能产生不必要的复杂性和带宽消耗。
9、Atom 按照RFC 3339标准(ISO 8601标准的一个子集)表示时间 ,而RSS 2.0 中没有指定统一的时间格式。
10、Atom 1.0 具有在 IANA 注册了的 MIME 类型,而 RSS 2.0 所使用的 application/rss+xml 并未注册。
11、Atom 1.0 标准包括一个 XML schema,RSS 2.0 却没有。
12、Atom 是IETF组织标准化程序下的一个开放的发展中标准,RSS 2.0 则不属于任何标准化组织,而且它不是开放版权的。
Atom 文档示例:
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
<title type="text">...</title>
<subtitle type="html">...</subtitle>
<updated>...</updated>
<id>...</id>
<link rel="alternate" type="text/html"
hreflang="en" href="http://example.org/"/>
<copyright>...</copyright>
<generator uri="http://www.example.com/" version="1.0"> ...</generator>
<entry>
<title>...</title>
<link rel="alternate" type="text/html"
href="http://example.org/2005/04/02/atom"/>
<link rel="enclosure" type="audio/mpeg" length="1337"
href="http://example.org/audio/ph34r_my_podcast.mp3"/>
<id>...</id>
<updated>...</updated>
<published>...</published>
<author>
<name>...</name>
<uri>...</uri>
<email>...</email>
</author>
<contributor>
<name>...</name>
<uri>...</uri>
</contributor>
<contributor>
<name>...</name>
<uri>...</uri>
</contributor>
<content type="xhtml" xml:lang="en"
xml:base="http://diveintomark.org/">...</content>
</entry>
</feed>