.NET中的内存管理
.NET中的内存管理通常会被认为是GC(Garbage Collection)的事情,程序员不用太操心。的确,GC通过对托管堆(Managed Heap)的管理,使我们(程序员们)有机会从繁琐的诸如内存泄漏之类的问题中解放出来,将精力专注于程序的逻辑上。然而,将所有的事情都交给GC有时会损及程序的效率,严重的甚至可能导致错误。这是由于,GC虽然可以有效地管理托管对象(Managed Object),但是对于那些非托管资源(例如文件句柄、Socket链接等)或者需要特别关照的对象(例如Bitmap对象等),GC的表现就不是那么尽如人意了。对于这些工作,GC需要程序员的协助才能很好的完成。因此,有效地利用GC进行内存管理,在.NET中是很重要的。这也是在对.NET程序进行优化时应当考虑的方向之一。
Garbage Collection
关于GC原理的讨论已经有很多非常好的文章了。记得《程序员》2003年第一期上也专门做过一期关于GC的专题,其中裘宗燕老师的文章——《Garbage Collection——问题和技术》将GC的技术原理剖析的十分透彻。因此本文不打算对GC的原理做过多的讨论,如果你在这方面有所疑惑,可以参考这篇文章。
简单说来,.NET CLR所使用的垃圾收集器是一种典型的分代式(generational)、标记-压紧型(mark-and-compact)收集器。它将整个托管堆分成数个(默认是3个)generation,利用标记-清除(mark-and-clean)算法对这几个generation进行垃圾回收,然后对托管堆进行整理,将非垃圾数据压紧以减少内存碎片。
为了尽量提高算法效率,.NET CLR实现了两种类型的GC:工作站GC(mscorwks.dll)和服务器GC(mscorsvr.dll)。当运行时(run-time)被加载到进程中时,可以通过CorBindToRuntimeEx()函数选择使用哪种GC。服务器GC是专门针对具有多处理器的服务器系统而设计的,它采用并行算法,每个CPU都具有一个GC,当进行GC过程时,该CPU上的程序会暂停。这样的设计能够尽量提高服务器的数据吞吐量。而所有的单处理器系统都工作在工作站GC模式下,工作站GC不存在并行模式,它的设计目标是尽可能减少垃圾回收过程中程序暂停的次数。很显然,如果在多处理器系统中使用工作站GC,无疑会降低系统的性能,无法发挥多处理器的强大威力。因此,选择合适的GC使有效的内存管理的第一步。
Dispose() vs. Finalize()
对于前文提到的那些非托管资源,通常在释放之前需要做一些适当的清理工作。.NET提供了Dispose()和Finalize()两个途径来执行这些清理工作。那么这两种方式的区别是什么呢?简单说来,Dispose()是提供给程序员调用的;而Finalize()是让GC调用的。二者的具体区别见下表:
Dispose()与Finalize()的主要区别
|
Dispose() |
Finalize() |
由谁调用? |
程序员 |
GC |
何时调用? |
由程序员决定 |
不可预知 |
以何种顺序调用? |
由程序员决定 |
不可预知 |
资源何时释放? |
调用结束后 |
下次GC过程之后,在此之前对象仍可用。 |
之所以有如此的不同是由于,当一个具有Finalizer(Finalize()方法)的对象被标记为可被回收时,GC并不直接回收它,而是将它的一个引用添加到一个特殊的队列里。一个独立的线程遍历这个队列,逐个调用队列中每个元素的Finalize()方法。Finalize()方法被调用过的对象会在下一次GC过程时被释放。程序员无权控制这个线程,同时也不能访问这个队列。而Dispose()是IDisposable接口的一部分,这个接口专门用来实现对象的清理工作。
基于以上的区别,我们有四种策略来实现对象的清理。
1、 同时实现Dispose()和Finalize()。
对于同时具有托管资源和非托管资源的对象,这种方法是.NET所推荐使用的。实现Dispose()方法能够使程序员在已知资源不再使用时立即释放它。但由于Dispose()强迫程序员必须做显示的调用才能释放资源,因此实现Finalize()能够保证在Dispose()没被调用时也能正确地释放资源。
典型的实现模式如下:
public class Sample : IDisposable
{
// Implement IDisposable.
public void Dispose()
{
Dispose(true);
// Forbid GC to call finalizer.
GC.SuppressFinalizer(this);
}
protected virtual void Dispose(bool disposing)
{
if (disposing)
{
// Free managed objects.
}
// Free unmanaged objects, and set large fields to null.
}
// Finalizer.
~Sample()
{
Dispose(false);
}
}
在C#和Managed C++中,使用析构函数来实现Finalize()方法。析构函数能够自动产生Finalize()方法,并生成对基类Finalize()方法的调用[1]。
2、 只实现Dispose()方法。
这适用于只包含托管资源的对象。如果你想为这类对象提供明确的释放资源的机会,可以采用这种方式。典型的实现模式如下:
public class Sample : IDisposable
{
// Implement IDisposable.
public virtual void Dispose()
{
// Free managed objects.
}
}
3、 只实现Finalize()。
这种方式不推荐使用,它只适合于程序员无法确定资源何时能够被释放,或者所用到的资源复杂到无法通过显示的方式释放,只能通过Finalize()强行回收。这两种情况不应该出现在设计良好的项目中,如果你不得不使用这种方式,那么你首先应当回头检查你的设计。
实现代码如下:
public class Sample
{
// Implement IDisposable.
~Sample()
{
}
}
4、 既不实现Dispose(),也不实现Finalize()。
这种方式适用于仅包含对其他托管对象的引用的对象,这些引用既不需要Dispose,也不需要Finalize。
总结
在使用Dispose()和Finalize()来协助GC进行高效的内存管理时,以下一些规则应当遵守:
·对象使用完毕应当立即释放(设为null,或调用它的Dispose()方法)。
·对于使用到非托管资源的对象,应当同时实现Dispose()和Finalize()方法来进行清理工作。
·应当禁止调用已经被Dispose的对象,“重新创建已被Dispose的对象”这个模式很难实现(.NET Framework无能为力)。
·应当保证Dispose()被调用两遍不会抛出异常。
·必须实现Finalize()时,应当同时实现IDisposable接口(也就是Dispose()方法)。
·只在不得不用的地方,或者不得不用的时候,使用Finalize()。