愉快的学习并且进步着(一)
个人网站http://www.massany.cn/之前的版本是在页面打开的时候,才去读取RSS源,以致于第一次访问的时候速度很慢。虽然RSS Toolkit也有自己的缓存机制,但是整体的运行速度还是很慢,而且并不利于一些有价值的新闻内容进行保存。所以考虑了定时多线程读取RSS源的方法。
在Global.aspx的Application_Start里,设置了一个定时器,定时读取RSS源。这里的关键是读取RSS源的多线程处理问题,一开始使用了Thread类来启动多个线程,每个线程都访问一个公共的Queue对象来分配读取任务。其实在C#里还有更简单的方法就可以完成多线程操作,使用线程池ThreadPool类。使用ThreadPool可以不必再关注线程的线节,只需要提供回调方法,线程的调度由线程池来完成。
取数据源的代码很简单。
DataSet ds = new DataSet();
string strSql = "select DefaultState,ID from Widget where Url = 'Widgets/RssWidget.ascx'";
//出错的频道暂时不进行处理。
if (_ErrQueue.Count > 0)
{
strSql += " and (";
foreach (DataRow dr in _ErrQueue)
{
strSql += " id <> " + dr["id"] + " or ";
}
strSql += " 1=0 )";
}
SqlHelper.FillDataset(SqlHelper.ConnectionString, CommandType.Text, strSql, ds, null);
string strSql = "select DefaultState,ID from Widget where Url = 'Widgets/RssWidget.ascx'";
//出错的频道暂时不进行处理。
if (_ErrQueue.Count > 0)
{
strSql += " and (";
foreach (DataRow dr in _ErrQueue)
{
strSql += " id <> " + dr["id"] + " or ";
}
strSql += " 1=0 )";
}
SqlHelper.FillDataset(SqlHelper.ConnectionString, CommandType.Text, strSql, ds, null);
下面将回调方法加入线程池队列:
foreach (DataRow dr in ds.Tables[0].Rows)
{
//_Queue.Enqueue(dr);
ThreadPool.QueueUserWorkItem(new WaitCallback(CallBack), dr);
}
{
//_Queue.Enqueue(dr);
ThreadPool.QueueUserWorkItem(new WaitCallback(CallBack), dr);
}
回调方法CallBack,要特别注意这个lock,之前的代码并没有这个lock,导致了生插入到数据库中的频道内容顺序是混乱的,有了lock后,保证了插入的记录是按频道来排序的。
lock (_Lock)
{
try
{
GenericRssChannel channel = GenericRssChannel.LoadChannel(GetUrl(dr["DefaultState"] as string));
foreach (GenericRssElement item in channel.Items)
{
object objResult = SqlHelper.ExecuteScalar(SqlHelper.ConnectionString, CommandType.Text, string.Format("select count(*) from RssChannel where WidgetId = {0} and link = '{1}'", dr["id"], item.Attributes["link"]));
if (objResult == null ||
Convert.ToInt32(objResult) < 1)
{
string strPubDate = "";
DateTime dtPubDate;
if (!item.Attributes.TryGetValue("pubDate", out strPubDate))
{
dtPubDate = Convert.ToDateTime(strPubDate);
}
else
{
dtPubDate = DateTime.Now;
}
string strSql = null;
//SqliteHelper.ExecuteNonQuery(string.Format(_DeleteSql, item.Attributes["link"]));
string strCatetory = "";
string strDescription = "";
if (!item.Attributes.TryGetValue("category", out strCatetory))
{
strCatetory = "";
}
if (!item.Attributes.TryGetValue("description", out strDescription))
{
strDescription = "";
}
strSql = string.Format(_InsertSql, item.Attributes["title"].Replace("'", "\"")
, dr["id"]
, item.Attributes["link"]
, strDescription.Replace("'", "\"")
, strCatetory
, dtPubDate);
SqlHelper.ExecuteNonQuery(SqlHelper.ConnectionString, CommandType.Text, strSql);
}
}
}
catch (System.Xml.XmlException)
{
_ErrQueue.Enqueue(dr);
}
catch (System.Net.WebException)
{
_ErrQueue.Enqueue(dr);
}
catch (Exception ex)
{
log.Error(ex.Message, ex);
_ErrQueue.Enqueue(dr);
}
}
{
try
{
GenericRssChannel channel = GenericRssChannel.LoadChannel(GetUrl(dr["DefaultState"] as string));
foreach (GenericRssElement item in channel.Items)
{
object objResult = SqlHelper.ExecuteScalar(SqlHelper.ConnectionString, CommandType.Text, string.Format("select count(*) from RssChannel where WidgetId = {0} and link = '{1}'", dr["id"], item.Attributes["link"]));
if (objResult == null ||
Convert.ToInt32(objResult) < 1)
{
string strPubDate = "";
DateTime dtPubDate;
if (!item.Attributes.TryGetValue("pubDate", out strPubDate))
{
dtPubDate = Convert.ToDateTime(strPubDate);
}
else
{
dtPubDate = DateTime.Now;
}
string strSql = null;
//SqliteHelper.ExecuteNonQuery(string.Format(_DeleteSql, item.Attributes["link"]));
string strCatetory = "";
string strDescription = "";
if (!item.Attributes.TryGetValue("category", out strCatetory))
{
strCatetory = "";
}
if (!item.Attributes.TryGetValue("description", out strDescription))
{
strDescription = "";
}
strSql = string.Format(_InsertSql, item.Attributes["title"].Replace("'", "\"")
, dr["id"]
, item.Attributes["link"]
, strDescription.Replace("'", "\"")
, strCatetory
, dtPubDate);
SqlHelper.ExecuteNonQuery(SqlHelper.ConnectionString, CommandType.Text, strSql);
}
}
}
catch (System.Xml.XmlException)
{
_ErrQueue.Enqueue(dr);
}
catch (System.Net.WebException)
{
_ErrQueue.Enqueue(dr);
}
catch (Exception ex)
{
log.Error(ex.Message, ex);
_ErrQueue.Enqueue(dr);
}
}
再启动一批线程来处理出错的频道:
for (int i = 0; i < _ErrQueue.Count; i++)
{
ThreadPool.QueueUserWorkItem(new WaitCallback(ErrorCallBack),_ErrQueue.Dequeue());
}
{
ThreadPool.QueueUserWorkItem(new WaitCallback(ErrorCallBack),_ErrQueue.Dequeue());
}
错误处理回调方法:
static void ErrorCallBack(Object stateInfo)
{
LoadXML(stateInfo as DataRow);
Thread.Sleep(1000);
}
{
LoadXML(stateInfo as DataRow);
Thread.Sleep(1000);
}
看看,是简单吧!对于多线程和RSS频道缓存,这是目前我能想到的解决办法,如果大家有更好的主意,不妨交流一下。
我的联系方式:
e-mail:jinyongjinyong@gmail.com
QQ:24615289