CLR、内存分配和垃圾回收
一、CLR
CLR:即公共语言运行时(Common Language Runtime),是中间语言(IL)的运行时环境,负责将编译生成的MSIL编译成计算机可以识别的机器码,负责资源管理(内存分配和垃圾回收等)。
可能有人会提问:为什么不直接编译成机器码,而要先编译成IL,然后在编译成机器码呢?
原因是:计算机的操作系统不同(分为32位和64位),接受的计算机指令也是不同的,在不同的操作系统中就要进行不同的编译,写出的代码在不同的操作系统中要进行不同的修改。中间增加了IL层,不管是什么操作系统,编译生成的IL都是相同的,IL被不同操作系统的CLR编译成机器码,最终被计算机执行。
JIT:即时编译器,负责编译成机器码。
二、内存分配
内存分配:指程序运行时,进程占用的内存,由CLR负责分配。
值类型:值类型是struct的,例如:int、datetime等。
引用类型:即class,例如:类、接口,string等。
1、栈
栈:即线程栈,先进后出的一种数据结构,随着线程而分配,其顺序如下:
看下面的例子:
定义一个结构类型
1 public struct ValuePoint 2 { 3 public int x; 4 public ValuePoint(int x) 5 { 6 this.x = x; 7 } 8 }
在方法里面调用:
1 //先声明变量,没有初始化 但是我可以正常赋值 跟类不同 2 ValuePoint valuePoint; 3 valuePoint.x = 123; 4 5 ValuePoint point = new ValuePoint(); 6 Console.WriteLine(valuePoint.x);
内存分配情况如下图所示:
注意:
(1)、值类型分配在线程栈上面,变量和值都是在线程栈上面。
(2)、值类型可以先声明变量而不用初始化。
2、堆
堆:对象堆,是进程中独立划出来的一块内存,有时一些对象需要长期使用不释放、对象的重用,这些对象就需要放到堆上。
来看下面的例子:
定义一个类
1 public class ReferencePoint 2 { 3 public int x; 4 public ReferencePoint(int x) 5 { 6 this.x = x; 7 } 8 }
在代码中调用:
1 ReferencePoint referencePoint = new ReferencePoint(123); 2 Console.WriteLine(referencePoint.x);
其内存分配如下:
注意:
(1)、引用类型分配在堆上面,变量在栈上面,值在堆上面。
(2)、引用类型分配内存的步骤:
a、new的时候去对象堆里面开辟一块内存,分配一个内存地址。
b、调用构造函数(因为在构造函数里面可以使用this),这时才执行构造函数。
c、把地址引用传给栈上面的变量。
3、复杂类型
a、引用类型里面嵌套值类型
先看下面引用类型的定义:
1 public class ReferenceTypeClass 2 { 3 private int _valueTypeField; 4 public ReferenceTypeClass() 5 { 6 _valueTypeField = 0; 7 } 8 public void Method() 9 { 10 int valueTypeLocalVariable = 0; 11 } 12 }
在一个引用类型里面定义了一个值类型的属性:_valueTypeField和一个值类型的局部变量:valueTypeLocalVariable,那么这两个值类型是如何进行内存分配的呢?其内存分配如下:
内存分配为什么是这种情况呢?值类型不应该是都分配在栈上面吗?为什么一个是分配在堆上面,一个是分配在栈上面呢?
_valueTypeField分配在堆上面比较好理解,因为引用类型是在堆上面分配了一整块内存,引用类型里面的属性也是在堆上面分配内存。
valueTypeLocalVariable分配在栈上面是因为valueTypeLocalVariable是一个全新的局部变量,调用方法的时候,会启用一个线程去调用,线程栈来调用方法,然后把局部变量分配到栈上面。
b、值类型里面嵌套引用类型
先来看看值类型的定义:
1 public struct ValueTypeStruct 2 { 3 private object _referenceTypeField; 4 public ValueTypeStruct(int x) 5 { 6 _referenceTypeField = new object(); 7 } 8 public void Method() 9 { 10 object referenceTypeLocalVariable = new object(); 11 } 12 }
在值类型里面定义了引用类型,其内存是如何分配的呢?其内存分配如下:
从上面的截图中可以看出:值类型里面的引用类型的变量分配在栈上,值分配在堆上。
总结:
1、方法的局部变量
根据变量自身的类型决定,与所在的环境没关系。变量如果是值类型,就分配在栈上。变量如果是引用类型,内存地址的引用存放在栈上,值存放在堆上。
2、对象是引用类型
其属性/字段,都是在堆上分配内存。
3、对象是值类型
其属性/字段由自身的类型决定。属性/字段是值类型就分配在栈上;属性/字段是引用类型就分配在堆上。
上面的三种情况可以概括成下面一句话:
引用类型在任何时候都是分配在堆上;值类型任何时候都是分配在栈上,除非值类型是在引用类型里面。
4、String字符串的内存分配
首先要明确一点:string是引用类型。
先看看下面的例子:
string student = "大山";//在堆上面开辟一块儿内存 存放“大山” 返还一个引用(student变量)存放在栈上
其内存分配如下图所示:
这时,在声明一个变量student2,然后用student给student2赋值:
1 string student2 = student;
这时内存是如何分配的呢?其内存分配如下:
从上面的截图中可以看出:student2被student赋值的时候,是在栈上面复制一份student的引用给student2,然后student和student2都是指向堆上面的同一块内存。
输出student和student2的值:
1 Console.WriteLine("student的值是:" + student); 2 Console.WriteLine("student2的值是:"+student2);
结果:
从结果可以看出:student和student2的值是一样的,这也能说明student和student2指向的是同一块内存。
这时修改student2的值:
1 student2 = "App";
这时在输出student和student2的值,其结果如下图所示:
从结果中可以看出:student的值保持不变,student2的值变为App,为什么是这样呢?这是因为string字符串的不可变性造成的。一个string变量一旦声明并初始化以后,其在堆上面分配的值就不会改变了。这时修改student2的值,并不会去修改堆上面分配的值,而是重新在堆上面开辟一块内存来存放student2修改后的值。修改后的内存分配如下:
在看下面一个例子:
1 string student = "大山"; 2 string student2 = "App"; 3 student2 = "大山"; 4 Console.WriteLine(object.ReferenceEquals(student,student2));
结果:
可能有人会想:按照上面讲解的,student和student2应该指向的是不同的内存地址,结果应该是false啊,为什么会是true呢?这是因为CLR在分配内存的时候,会查找是否有相同的值,如果有相同的值,就重用;如果没有,这时在重新开辟一块内存。所以修改student2以后,student和student2都是指向同一块内存,结果输出是true。
注意:
这里需要区分string和其他引用类型的内存分配。其他引用类型的情况和string正好相反。看下面的例子
先定义一个Refence类,里面有一个int类型的属性,类定义如下:
1 public class Refence 2 { 3 public int Value { get; set; } 4 }
在Main()方法里面调用:
1 Refence r1 = new Refence(); 2 r1.Value = 30; 3 Refence r2 = r1; 4 Console.WriteLine($"r2.Value的值:{r2.Value}"); 5 r2.Value = 50; 6 Console.WriteLine($"r1.Value的值:{r1.Value}"); 7 Console.ReadKey();
结果:
从运行结果可以看出,如果是普通的引用类型,如果修改其他一个实例的值,那么另一个实例的值也会改变。正好与string类型相反。
三、内存回收
值类型存放在线程栈上,线程栈是每次调用都会产生,用完自己就会释放。
引用类型存放在堆上面,全局共享一个堆,空间有限,所以才需要垃圾回收。
CLR在堆上面是连续分配内存的。
1、C#中的资源分为两类:
a、托管资源
由CLR管理的存在于托管堆上的称为托管资源,注意这里有2个关键点,第一是由CLR管理,第二存在于托管堆上。托管资源的回收工作是不需要人工干预的,CLR会在合适的时候调用GC(垃圾回收器)进行回收。
b、非托管资源
非托管资源是不由CLR管理,例如:Image Socket, StreamWriter, Timer, Tooltip, 文件句柄, GDI资源, 数据库连接等等资源(这里仅仅列举出几个常用的)。这些资源GC是不会自动回收的,需要手动释放。
2、托管资源
a、垃圾回收期(GC)
定期或在内存不够时,通过销毁不再需要或不再被引用的对象,来释放内存,是CLR的一个重要组件。
b、垃圾回收器销毁对象的两个条件
1)对象不再被引用----设置对象=null。
2)对象在销毁器列表中没有被标记。
c、垃圾回收发生时机
1)垃圾回收发生在new的时候,new一个对象时,会在堆中开辟一块内存,这时会查看内存空间是否充足,如果内存空间不够,则进行垃圾回收。
2)程序退出的时候也会进行垃圾回收。
d、垃圾回收期工作原理
GC定期检查对象是否未被引用,如果对象没有被引用,则在检查销毁器列表。若在销毁器列表中没有标记,则立即回收。若在销毁器列表中有标记,则开启销毁器线程,由该线程调用析构函数,析构函数执行完,删除销毁器列表中的标记。
注意:
不建议写析构函数,原因如下:
1)对象即使不用,也会在内存中驻留很长一段时间。
2)销毁器线程为单独的线程,非常耗费资源。
e、优化策略
1)分级策略
a、首次GC前 全部对象都是0级。
b、第一次GC后,还保留的对象叫1级。这时新创建的对象就是0级。
c、垃圾回收时,先查找0级对象,如果空间还不够,再去找1级对象,这之后,还存在的一级对象就变成2级,0级对象就变成一级对象。
d、垃圾回收时如果0~2级都不够,那么就内存溢出了。
注意:
越是最近分配的,越是会被回收。因为最近分配的都是0级对象,每次垃圾回收时都是先查询0级对象。
3、非托管资源
上面讲的都是针对托管资源的,托管资源会被GC回收,不需要考虑释放。但是,垃圾回收器不知道如何释放非托管的资源(例如,文件句柄、网络连接和数据库连接)。托管类在封装对非托管资源的直接或间接引用时,需要制定专门的规则,确保非托管的资源在回收类的一个实例时会被释放。
在定义一个类时,可以使用两种机制来自动释放非托管的资源。这些机制常常放在一起实现,因为每种机制都为问题提供了略为不同的解决方法。这两种机制是:
a、声明一个析构函数(或终结器),作为类的一个成员。
b、在类中实现System.IDisposable接口。
1)、析构函数或终结器
析构函数看起来类似于一个方法:与包含的类同名,但有一个前缀波形符号(~)。它没有返回值,不带参数,也没有访问修饰符。看下面的一个例子:
1 public class MyClass 2 { 3 /// <summary> 4 /// 析构函数 5 /// </summary> 6 ~MyClass() 7 { 8 // 要执行的代码 9 } 10 }
析构函数存在的问题:
a、由于使用C#时垃圾回收器的工作方式,无法确定C#对象的析构函数何时执行。所以,不能在析构函数中放置需要在某一时刻运行的代码,也不应该寄希望于析构函数会以特定顺序对不同类的实例调用。如果对象占用了宝贵而重要的资源,应尽快释放这些资源,此时就不能等待垃圾回收器来释放了。
b、C#析构函数的实现会延迟对象最终从内存中删除的时间。没有析构函数的对象会在垃圾回收器的一次处理中从内存中删除,但有析构函数的对象需要两次处理才能销毁:第一次调用析构函数时,没有删除对象,第二次调用才真正删除对象。
c、运行库使用一个线程来执行所有对象的Finalize()方法。如果频繁使用析构函数,而且使用它们执行长时间的清理任务,对性能的影响就会非常显著。
注意:
在讨论C#中的析构函数时,在低层的.NET体系结构中,这些函数称为终结器(finalizer)。在C#中定义析构函数时,编译器发送给程序集的实际上是Finalize()方法,它不会影响源代码。C#编译器在编译析构函数时,它会隐式地把析构函数的代码编译为等价于重写Finalize()方法的代码,从而确保执行父类的Finalize()方法。例如,下面的C#代码等价于编译器为~MyClass()析构函数生成的IL:
1 protected override void Finalize() 2 { 3 try 4 { 5 // 析构函数中要执行的代码 6 } 7 finally 8 { 9 // 调用父类的Finalize()方法 10 base.Finalize(); 11 } 12 }
2)、IDisposable接口
在C#中,推荐使用System.IDisposable接口替代析构函数。IDisposable接口定义了一种模式,该模式为释放非托管的资源提供了确定的机制,并避免产生析构函数固有的与垃圾回收器相关的问题。IDisposable接口声明了一个Dispose()方法,它不带参数,返回void。例如:
1 public class People : IDisposable 2 { 3 public void Dispose() 4 { 5 this.Dispose(); 6 } 7 }
Dispose()方法的实现代码显式地释放由对象直接使用的所有非托管资源,并在所有也实现了IDisposable接口的封装对象上调用Dispose()方法。这样,Dispose()方法为何时释放非托管资源提供了精确的控制。
3)、using语句
C#提供了一种语法,可以确保在实现了IDisposable接口的对象的引用超出作用域时,在该对象上自动调用Dispose()方法。该语法使用了using关键字来完成此工作。例如:
1 using (var people = new People()) 2 { 3 // 要处理的代码 4 }
4)、析构函数和Dispose()的区别
a、析构函数
析构函数 主要是用来释放非托管资源,等着GC的时候去把非托管资源释放掉 系统自动执行。GC回收的时候,CLR一定调用的,但是可能有延迟(释放对象不知道要多久呢)。
b、Dispose()
Dispose() 也是释放非托管资源的,主动释放,方法本身是没有意义的,我们需要在方法里面实现对资源的释放。GC的时候不会调用Dispose()方法,而是使用对象时,使用者主动调用这个方法,去释放非托管资源。
5)、终结器和IDisposable接口的规则
a、如果类定义了实现IDisposable的成员(类里面的属性实现了IDisposable接口),那么该类也应该实现IDisposable接口。
b、实现IDisposable并不意味着也应该实现一个终结器。终结器会带来额外的开销,因为它需要创建一个对象,释放该对象的内存,需要GC的额外处理。只在需要时才应该实现终结器,例如。发布本机资源。要释放本机资源,就需要终结器。
c、如果实现了终结器,也应该实现IDisposable接口。这样,本机资源可以早些释放,而不仅是在GC找出被占用的资源时,才释放资源。
d、在终结器的实现代码中,不能访问已经终结的对象。终结器的执行顺序是没有保证的。
e、如果所使用的一个对象实现了IDisposable接口,就在不再需要对象时调用Dispose方法。如果在方法中使用这个对象,using语句比较方便。如果对象是类的一个成员,那么类也应该实现IDisposable接口。