和我一起作Tess的windbg lab - Lab7, MemoryLeak
原文地址:http://blogs.msdn.com/b/tess/archive/2008/03/25/net-debugging-demos-lab-7-memory-leak.aspx
操作步骤:
1、产生压力:tinyget -srv:localhost -uri:/BuggyBits/News.aspx -threads:500 -loop:200
2、抓一个hang的dump,看看gc heap大小,!eeheap -gc,如下:
GC Heap Size 0x1899f44c(412742732),大概400M,dump文件整个为550M。
3、看一下gc heap的总体状况:!dumpheap -stat,输出如下:
7912d7c0 1342 400044140 System.Int32[]
嗯,一共1300多个数组,但是这些数组居然占了400M,和gc heap的大小差不多。
4、察看一下详细情况,因为只有1300多个,所以我们可以全部打印出来:!dumpheap -mt 7912d7c0
5、几乎所有的数组,大小都是400K,随便找一个,然后找一下该数组的root,运行!gcroot 1f981e60,结果如下:
Scan Thread 49 OSTHread 2234
DOMAIN(00115B40):HANDLE(WeakLn):24b10dc:Root:02a621f4(System.Web.NativeFileChangeNotification)->
02a621d8(System.Web.DirMonCompletion)->
02a61ea4(System.Web.DirectoryMonitor)->
02a61ec8(System.Collections.Hashtable)->
02a61f00(System.Collections.Hashtable+bucket[])->
02a62100(System.Web.FileMonitor)->
02a62134(System.Collections.Specialized.HybridDictionary)->
02a62178(System.Collections.Specialized.ListDictionary)->
02a62194(System.Collections.Specialized.ListDictionary+DictionaryNode)->
02a5d538(System.Web.Compilation.BuildManager)->
02a5e0fc(System.Web.Compilation.MemoryBuildResultCache)->
02a2c970(System.Web.Caching.CacheSingle)->
02a2ca00(System.Web.Caching.CacheExpires)->
02a2ca20(System.Object[])->
02a2cd64(System.Web.Caching.ExpiresBucket)->
02b2e948(System.Web.Caching.ExpiresPage[])->
1b078ff0(System.Web.Caching.ExpiresEntry[])->
1b20583c(System.Web.Caching.CacheEntry)->
1b20581c(System.Web.Caching.CacheItemRemovedCallback)->
1b203db0(ASP.news_aspx)->
1f981e60(System.Int32[])
6、看其他的几个数组,引用顺序差不多。
7、猜测:代码中用了cache,cache中包含了一个400K的数组。但是由于某种原因,cache里面的东西没释放掉,越来越大。
8、查看源代码
protected void Page_Load(object sender, EventArgs e)
{
string news = "<I>New site launched 2008-02-02</I>";
string key = Guid.NewGuid().ToString();
Cache.Add(key, news, null, Cache.NoAbsoluteExpiration, new TimeSpan(0, 5, 0), CacheItemPriority.NotRemovable, new CacheItemRemovedCallback(this.RemovedCallback));
lblNews.Text = ((string)Cache[key]);
}
Cache有一个5分钟的失效期。但是由于我们的测试中,负载上来了,还没有到5分钟,所以看到的cache还在内存中。那么5分钟之后呢,可能会消失。但是更可能的是,在3分钟的时候,负载太大了,cache的东西又加上来了,最终导致OOM,程序挂了。
Over