利用Cache缓存数据DataTable数据提高大数据量访问性能

Cache 即高速缓存 ,我想很多人对他的第一印象一定像我一样,感觉他一定能提高系统得性能和运行速度。的确。Net推出cache的初衷确实是这样的。那么cache是如何提高系统性能与运行速度呢?是不是在任何情况下用cache都能提高性能?是不是cache用的越多就越好呢?我在近期开发的项目中有所体会,写下来当作总结也希望能跟大家一起探讨探讨,有错误的地方希望大家批评指正。

  1. Cache 是如何工作的。

  • Cache 是分配在服务器上的一个公共的内存片。
    所谓公共指的cache只要一创建是任何一个客户端浏览器都可以通过后台代码访问到它,它面向的是所有用户,相对而言session也是服务器上的一段内存,但他面向的是单个用户。它是服务器的一段内存块,也就是说每个cache一经创建就占用了服务器资源的。所以从这点来说我们就可以说:并不是cache越多越好。
  • cache 是有时间限制的,超过了服务器设定的过期时间,它就会被服务器回收。
  • cache 可以存放任何对象

  2. Cache 如何创建以及如何销毁。

  • 创建cache
    在。Net环境下通过Cache.Insert(string key,object o)方法创建。其中key 代表cache的ID,o代表存到cache里的对象。
  • 销毁cache.
    通过方法Cache.Remove(string key)其中key 代表cache的 ID。
  • 调用cache.
    Cache支持装箱/拆箱操作。如你可以把一个DataSet对象ds通过Cache.Insert("dsCache",ds)的方式存到Cache中,可以通过拆箱操作 DataSet ds = (DataSet)Cache["dsCache"]来访问它。

  3. 什么时候用cache.
  Cache 一般用于数据较固定,用的较频繁的地方。例如可以把进销存系统中可以把产品信息存入cache,在用户调用产品信息时通过调用cache即可,这样从很大程度上减少了用户与数据库的交互,提高了系统的性能。反之,cache不适合用在数据变动快,使用范围很窄的地方。例如把一个具体采购单存入 cache中。

  4. cache 调用注意事项。
  Cache是有时间限制的。超过了服务器设置的过期时间,就会被服务器回收。当cache被回收后对应的内存块就会被清空,再次通过cache[“cachekey”]访问对象时返回的就是null值。所以以下这种调用就会出现异常:

DataSet ds = (DataSet)Cache[“cacheds”];
DataRow dr = ds.Table[0].Row[0]; //出错,ds为null值,不存在表0。

正确的写法应该是:

DataSet ds
If(Cache["cacheds"] != null) {
ds = (DataSet)Cache[“cacheds”];
}
Else {
ds= GetDsFromDataBase();
}
DataRow dr = ds.Table[0].Row[0];



在数据量不大的情况下,程序怎么写基本上性能差别不大,但是当我们面对数以万计的数据的时候,我想性能就是个不得不考虑的问题了,每写一个方法,每填充一笔数据都要考虑到性能问题,否则服务器将承担巨大的执行开销,如果服务器性能不好可能立即就死在那里了,所以在大数据量频繁访问的页面上,我们就必须考虑如何提高页面的性能了,本文将提供一种用cache提高访问性能的方法来解决此问题,在很大程度上提高页面加载数据的性能。本文列举的是论坛版块中帖子列表页面加载数据的实例。
正文:
每个版块帖子列表信息都会对应一个cache的名字,比如,我们可以按照规律设成
1 #region -- CacheName Setting --
2 boardCacheName = "Board" + boardID.ToString();
3 #endregion
4 
这里我们同样是采取数据集填充DataTable的方法创建数据的。不过,因为我们有了cache,所以,我们在第一次加载完数据后,会把数据压到cache中,然后每次填充DataTable前进行判断,如果cache为空时才加载,如果不为空,则不加载。
 1private DataTable BuildDataTable()
 2{
 3     // 数据缓存 机制
 4       if(Cache[boardCacheName] != null)
 5       {
 6              // Create DataTable From Cache
 7              DataTable dt = (DataTable)Cache[boardCacheName];
 8              return dt;
 9       }

10       else
11       {
12              // Create DataTable From DataBase
13              DataTable dt = new DataTable();
14 
15              -- Create DataTable --
23 
24              -- Add DataRow --
43 
44              // Push DataTable To Cache
45              Cache[boardCacheName] = dt;
46              return dt;
47       }

48}

49
 
上面的代码完成了数据填充过程,但更重要的是对数据进行管理,比如,我们改变一条住处的某些状态位来实现一些功能,比如,我们把贴子加成“酷贴”,这个时候就要对cache进行操作,特别注意一下,我们在上面的代码中还特别设置topicID这一列作为表的主值键,这样我们才能很快的定位到要管理的数据信息,方法如下。
 1 #region -- Cache Management --
 2 if(Cache["Board" + this.boardID.ToString()] != null)
 3 {
 4        DataTable dt = (DataTable)Cache["Board" + this.boardID.ToString()];
 5        DataRow dr = dt.Rows.Find(topicID);
 6        if(dr != null)
 7        {
 8               dr["CoolState"= 1;
 9               dr.AcceptChanges();
10               dt.AcceptChanges();
11        }
12 }
13 #endregion
14 
 
一点说明:其中的topicID是通过某种途径传过来的你想操作的信息的唯一标识字段,AcceptChanges方法更新保存相应对象数据自上一次更新以来所有的更改,另外对cache进行操作后,记得要重新绑定数据,另外也要同时更新数据库中的,本文认为读者具备对数据库数据进行操作的能力,便不作贅述。
那么我们如何来删除数据记录呢?我们是不是可以直接在找到dr的那一行下面,用个
dr.Delete()来把数据删除就完事了呢?答案是否,这样操作会出现问题,经测试对cache的添加和更新操作会立即生效,但删除某条记录的动作不会立即起作用,这样就会导致数据操作异步性,这是不可以的,同时1.1版本比1.0版本要稍微好一些,但还是解决不了异步性的问题,所以我们是不是必须把cache干掉,重新填充一下呢,如果你愿意这样做,自然也无可厚非,我这里提供另外一个思路供参考。
我们的解决方案是,在创建表格的时候多加一个删除标志位,比如DeleteState,当初从数据库中加载出来的时候都一律为1,然后经过删除操作以后,将这条信息的删除标志位置0(不要忘记同时操作数据库中的数据),然后绑定的时候对DataView进行过滤,dv.RowFilter = "DeleteState==1",便可以模拟出删除效果了。
数据经过这样的处理之后,访问性能会数以百倍的提高,数据只在cache失效后才会重新加载,用户对数据的访问都是对cache的操作,而且cache是服务器变量,对所有用户共享,这样,如果同时有一百个用户访问,也都是对同一个cache进行一百次访问,而程序访问cache是非常快的,如果不使用cache,那么,我们就要去跑一百次数据库操作,性能极差,尤其是当海量用户对海量数据进行访问的时候,服务器可谓苦不堪言,所以用cache来缓解负荷是相当必要且相对优良的一种方案,只是辛苦了那位在cache失效后第一次访问页面的那个用户,不过这种牺牲换来别人的高性能也是值得的嘛。
posted @ 2007-04-21 13:57  herobeast  阅读(3118)  评论(1编辑  收藏  举报