代码改变世界

(转)浅析C#编程中的内存管理

2009-03-17 16:45  K-imba  阅读(134)  评论(0编辑  收藏  举报
C#编程的一个优点是程序员不需要关心具体的内存管理,尤其是垃圾收集器会处理所有的内存清理工作。虽然不必手工管理内存,但如果要编写高质量的代码,还是要理解后台发生的事情,理解C#的内存管理。本文主要介绍给变量分配内存时计算机内存中发生的情况。

C#将数据分为两种:值数据类型和引用数据类型,这两种数据类型存储在内存中的不同的地方:值数据类型存储在堆栈中,而引用类型存储在内存的托管堆中。

1、内存简介
Windows使用一个系统:虚拟寻址系统。这个系统的作用是将程序可用的内存地址映射到硬件内存中的实际地址上。其实际结果就是32位的机子上每个进程都可以使用4GB的内存,当然,64位机这个数字就大了去了。这4GB的内存实际上包含了程序的所有的部分:可执行代码,DLL以及程序运行时使用的所有变量的内容。这个4GB的内存成为虚拟地址空间或虚拟内存。为方便,这里成为内存。

4GB中的每个存储单元都是从零开始向上存储的。要访问存储在内存中的某个空间中的值,就必须提供表示该存储单元的一个数字。在高级编程语言中,编译器的一个重要作用就是负责将人们可以理解的变量名称变为处理器可以理解的内存地址。

2、堆栈
在内存中,有一个区域成为堆栈,存储对象

对象成员的值数据类型调用方法时,传递给所有方法的参数的副本注意:调用方法时,堆栈存储的是所有参数的副本,因此,经值类型A传递给函数,A的值是不会变化的。当然,引用类型是会变化的,因为在堆栈中存储的是引用类型的地址,这在后面会有详细的介绍。

下面以一个例子来说明堆栈的工作方式,如下面的代码:


{
   int a;
//do something;
{
int b;
//do something
}

}

首先声明a,在内部的代码块中声明b,然后内部的代码块终止,b就出了作用域,最后a出作用域。所以b的生命周期总是包含在a的生命周期内,在释放变量的时候,其顺序总是和分配内存的顺序是相反的。即:变量的生存周期都是嵌套的。这就是堆栈的工作方式。

3、托管堆
堆栈具有相当高的性能,但是变量的生命周期必须是嵌套的,这个要求在有的时候过于苛刻。我们希望有一种别的方法来分配内存,存储一些数据,并在方法退出的很长一段时间内,这些数据仍然是可用的,这时,就使用托管堆。

托管堆(简称堆)是内存中的另外一个区域,我们仍然用一个例子来说明堆的工作方式,如下面代码:


{
Customer customer1;
customer1=new Customer();
Customer customer2=new Customer();
//do something
}

首先,声明一个Customer:customer1,在堆栈上给这个引用分配存储控件。请注意:仅仅是给这个引用分配存储空间,并不是实际的Customer对象。customer1占用4个字节的空间(32位机),来表示Customer对象在内存中的地址。

然后,执行第二行代码,完成以下操作:

在堆上分配存储空间,用来存储Customer对象,注意:这里是Customer对像。

将变量customer1的值设为分配给Customer对象的内存地址从这个例子中可以看出,建立引用类型的变量的过程要比奖励值类型变量的过程复杂,且不避免的有性能的降低。但是,我们可以将一个引用变量的值赋给另一个引用变量,当一个变量出作用域时,它会从堆栈中删除,但是对象的数据仍然保留在内存中,直到程序停止。

这样,我们在将一个引用变量A传递给函数时,仅仅是将变量A的引用传递给了函数,即:仅仅是在堆栈上分配内存,即变量B两者指向同一个内存地址。因此,当变量B发生变化时,变量A也会发生变化。

4、装箱和拆箱
装箱和拆箱就是值类型和引用类型的项目转化,装箱可以将值类型转化为引用类型,拆箱的作用正好相反,经引用类型转化为值类型。

5、垃圾收集
一般情况下。NET运行库会在认为需要的时候运行垃圾收集器来释放托管资源,

这在大多数情况下,足够了。就是说我们没有必要去关心内存。但在有的情况下,我们会强制垃圾回收集器在代码的某个地方运行,释放内存。这就用到了System.GC.Collect()。System.GC表示一个垃圾收集器。这种情况很少,例如:代码中大量的对象刚刚停止引用,就适合调用垃圾收集器。

总结

首先堆栈和堆(托管堆)都在进程的虚拟内存中。(在32位处理器上每个进程的虚拟内存为4GB)

堆栈stack
堆栈中存储值类型。

堆栈实际上是向下填充,即由高内存地址指向地内存地址填充。

堆栈的工作方式是先分配内存的变量后释放(先进后出原则)。

堆栈中的变量是从下向上释放,这样就保证了堆栈中先进后出的规则不与变量的生命周期起冲突!

堆栈的性能非常高,但是对于所有的变量来说还不太灵活,而且变量的生命周期必须嵌套。

通常我们希望使用一种方法分配内存来存储数据,并且方法退出后很长一段时间内数据仍然可以使用。此时就要用到堆(托管堆)!

堆(托管堆)heap
堆(托管堆)存储引用类型。

此堆非彼堆,.NET中的堆由垃圾收集器自动管理。

与堆栈不同,堆是从下往上分配,所以自由的空间都在已用空间的上面。

比如创建一个对象:

Customer cus;

cus = new Customer();

申明一个Customer的引用cus,在堆栈上给这个引用分配存储空间。这仅仅只是一个引用,不是实际的Customer对象!

cus占4个字节的空间,包含了存储Customer的引用地址。

接着分配堆上的内存以存储Customer对象的实例,假定Customer对象的实例是32字节,为了在堆上找到一个存储Customer对象的存储位置。

.NET运行库在堆中搜索第一个从未使用的,32字节的连续块存储Customer对象的实例!

然后把分配给Customer对象实例的地址赋给cus变量!

从这个例子中可以看出,建立对象引用的过程比建立值变量的过程复杂,且不能避免性能的降低!

实际上就是.NET运行库保存对的状态信息,在堆中添加新数据时,堆栈中的引用变量也要更新。

性能上损失很多!

有种机制在分配变量内存的时候,不会受到堆栈的限制:把一个引用变量的值赋给一个相同类型的变量,那么这两个变量就引用同一个堆中的对象。

当一个应用变量出作用域时,它会从堆栈中删除。但引用对象的数据仍然保留在堆中,一直到程序结束 或者 该数据不被任何变量应用时,垃圾收集器会删除它。