RSS原理和实现
RSS是在互联网上被广泛采用的内容包装和投递协议。网络用户可以在客户端借助于支持RSS的新闻工具软件,在不打开网站内容页面的情况下,阅读支持RSS输出的网站内容。
1.RSS文件结构
示例:
<rss version="2.0">
<channel>
<title>我的Blog</title> //channel的标题
<description>与我自己的技术Blog相关联</description> //channel的介绍
<link>http://counter.csdn.net/pv.aspx?id=72</link> //channel的url
<item>
<title><!-- 项标题 --></title> //item的标题
<link><!-- 项 URL --></link> //item的url
<description><!-- 简要描述 --></description> //item的介绍
<!-- 可选的/可扩展的元素 --> //item的其他属性,比如更新时间
</item>
<item>
<!-- 可多个<item>项目--> //一个channel有多个item
</item>
</channel>
</rss>
RSS是两级结构,第一级结构是channel,相当于blog系统中某人的blog,第二级结构是item,相当于blog中的文章。属性中最重要的是title、description和link,title是标题,description是介绍,link是与其相关的url。
2.RSS的使用
有的网站提供了RSS自动发现机制,可以很方便地把RSS的URL添加到RSS阅读器中。如果没有自动发现,那么可以手动把RSS链接的URL添加到RSS阅读器中,这样就加入了一个用户订阅的频道。在RSS阅读器中可以更新频道列表或点击一个item链接打开该item的页面。
3.RSS的工作机制
如下图所示:
内容提供者在其网站上添加RSS的链接,以提供RSS订阅功能,当打开这个链接时,传送过去了一些频道信息,比如:blog的作者名。
一种做法是,RSS链接URL指向的是一个空内容的页面,该页面后台程序通过传过来的频道信息访问数据库,获取频道列表,用Response.Write向该空页面写出XML格式的文件。
另一种做法是,RSS链接URL指向的是一个xml文件,该文件由服务器的程序事先生成好的,放在服务器上,访问时静态获取,服务器在作者每添加一个频道列表时自动更新该xml文件。
第一种做法的优点是管理方便,因为不需要为每个频道生成xml文件,所有的RSS请求都由一个后台页面处理,接口统一,但每次访问RSS链接时,都要动态地写出RSS频道列表,访问效率相对较低,第二种做法的优点是访问时,只是返回一个静态的xml文件,不需要访问数据库来临时生成,所以访问效率相对较高,但每更新一次频道列表中的项时,就要自动地重新生成xml文件以保证RSS文件的最新,这样就降低了更新的效率。本系统中采用的是第一种方法。
4.RSS的实现
RSS有两大部件:RSS链接和RSS阅读器。
4.1RSS链接的实现
4.1.1 RSS页面
(1)页面文件上使用标记来确定格式
用Repeater作为xml的载体,并不真正生成xml文件。<![CDATA[ ]]>语句用于转义,否则将被识别为有标记的文本块。
RssFeed.aspx
<asp:Repeater id="Repeater1" runat="server">
<HeaderTemplate>
<rss version="2.0">
<channel>
<title>NewsShow</title>
<link>http://192.168.1.7/MainOne_HZ/News/</link>
<description>Rss Feed for 192.168.1.7</description>
</HeaderTemplate>
<ItemTemplate>
<item>
<title><%# FormatForXML(DataBinder.Eval(Container.DataItem,"newsname")) %></title>
<description><![CDATA[<%#FormatForXML(DataBinder.Eval(Container.DataItem,"newsinfo"))%>]]></description>
<link>http://192.168.1.7/MainOne_HZ/News/NewsShow.aspx?ID=<%# DataBinder.Eval(Container.DataItem, "newsid") %></link>
<pubDate><%# String.Format("{0:R}",DataBinder.Eval(Container.DataItem,"wtime")) %></pubDate>
</item>
</ItemTemplate>
<FooterTemplate>
</channel>
</rss>
</FooterTemplate>
</asp:Repeater>
RssFeed.aspx.cs
{
// 在此处放置用户代码以初始化页面
if(!this.IsPostBack)
{
Response.ContentType="text/xml";
SqlConnection con=new SqlConnection(System.Configuration.ConfigurationSettings.AppSettings["ConnectionString"]);
SqlCommand cmd=new SqlCommand("select top 20 * from news order by newsid desc",con);
con.Open();
SqlDataReader dr=cmd.ExecuteReader();
Repeater1.DataSource=dr;
Repeater1.DataBind();
dr.Close();
con.Close();
}
}
protected string FormatForXML(object input)
{
string data=input.ToString();
data=data.Replace("&","&");
data=data.Replace("/",""");
data=data.Replace("'","&qapos;");
data=data.Replace("<","<");
data=data.Replace(">",">");
return data;
}
(2)后台cs文件使用Response.Write来输出格式
4.1.2写成xml文件
4.1.3使用RSS工具包
4.2RSS阅读器的实现
原理是把写有rss内容的xml文件读出来,然后再按结构写成html的格式
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head id="Head1" runat="server">
<title>简易RSS阅读器</title>
<script language="javascript" type="text/javascript">
// <!CDATA[
function ButtonExit_onclick() {
}
// ]]>
</script>
</head>
<body>
<form id="form1" runat="server">
<div>
<table style="width: 515px" align=center>
<tr>
<td colspan="3" style="height: 23px; text-align: center;" >
<span style="font-family: 华文中宋; font-weight: bold; color: white; font-style: normal; background-color: #6699cc; font-variant: small-caps;">简易RSS阅读器</span></td>
</tr>
<tr>
<td style="width: 1241px; height: 21px; text-align: right;">
<asp:Label ID="Label1" runat="server" Text="RSS地址:" Width="113px" Font-Names="宋体" Font-Size="Smaller"></asp:Label></td>
<td style="width: 8px; height: 21px" colspan="2">
<asp:TextBox ID="TextRSSUrl" runat="server"
Width="386px"></asp:TextBox></td>
</tr>
<tr>
<td colspan="3" style="text-align: center">
<asp:Button ID="ButtonSubmit" runat="server" OnClick="ButtonSubmit_Click" Text="提 交" />
<asp:Button ID="ButtonReset" runat="server" OnClick="Button1_Click" Text="重 填" />
<input id="ButtonExit" type="button" value="退 出" onclick="window.close();" /></td>
</tr>
</table>
</div>
</form>
</body>
</html>
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;
public partial class _Default : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
}
public void ProcessRSSItem(string rssURL)
{
System.Net.WebRequest myRequest = System.Net.WebRequest.Create(rssURL);
System.Net.WebResponse myResponse = myRequest.GetResponse();
System.IO.Stream rssStream = myResponse.GetResponseStream();
System.Xml.XmlDocument rssDoc = new System.Xml.XmlDocument();
rssDoc.Load(rssStream);
System.Xml.XmlNodeList rssItems = rssDoc.SelectNodes("rss/channel/item");
string title = "";
string link = "";
string description = "";
for (int i = 0; i < rssItems.Count; i++)
{
System.Xml.XmlNode rssDetail;
rssDetail = rssItems.Item(i).SelectSingleNode("title");
if (rssDetail != null)
{
title = rssDetail.InnerText;
}
else
{
title = "";
}
rssDetail = rssItems.Item(i).SelectSingleNode("link");
if (rssDetail != null)
{
link = rssDetail.InnerText;
}
else
{
link = "";
}
rssDetail = rssItems.Item(i).SelectSingleNode("description");
if (rssDetail != null)
{
description = rssDetail.InnerText;
}
else
{
description = "";
}
Response.Write("<p><b><a href='" + link + "' target='new'>" + title + "</a></b><br/>");
Response.Write(description + "</p>");
}
}
protected void ButtonSubmit_Click(object sender, EventArgs e)
{
string RSSURL = TextRSSUrl.Text;
if (RSSURL != "")
{
ProcessRSSItem(RSSURL);
}
else
{
Response.Write(RSSURL);
Response.Write("<font size=5><b>Site: " + RSSURL + "</b></font><Br />");
Response.Write("RSS地址不能为空");
}
}
protected void Button1_Click(object sender, EventArgs e)
{
TextRSSUrl.Text = "";
}
}
转自:http://blog.csdn.net/tsd3698/archive/2007/06/25/1665554.aspx 感谢作者:tsd3698