C#知识树整理——内存探索

C#内存管理

    • 数据类型 32位 64位 取值范围(32位)
      char -(没测试) 2
      byte 1 1 0~255
      sbyte 1 1 –32,768~32,767
      ushort 2 2 0~65,535
      int 4 4 -2,147,483,648~2,147,483,647
      uint 4 4 0~4,294,967,295
      ulong 4 8 0~4,294,967,295
      float 4 4 3.4E +/- 38 (7 digits)
      double 8 8 1.7E +/- 308 (15 digits)
    • 求struct 和class 的大小

      public struct MyStructNull
      {
      }
      public struct MyStruct
      {
          private int a;
      }
      
      public class MyClassNull
      {
      }
      
      public class MyClassint
      {
          private int a;
      }
      
      public class MyClassLong
      {
          private long a;
      }
      
      public class MyClassByte
      {
          private byte a1;
          private byte a2;
          private byte a3;
      }
      
      static class Program
      {
          private static void CaculateMemory<T>(Func<T> action)
          {
              GC.Collect(0);
              long start = GC.GetTotalMemory(true);
              var a = action();
              GC.Collect(0);
              long end = GC.GetTotalMemory(true);
              Console.WriteLine(end - start);
          }
          
          static void Main()
          {
              Console.WriteLine(Marshal.SizeOf(new MyStructNull()));//1
              Console.WriteLine(Marshal.SizeOf(new MyStruct()));//4
              CaculateMemory((() =>
              {
                  return new MyClassNull();
              }));//12
              CaculateMemory((() =>
              {
                  return new MyClassint();
              }));//12
              CaculateMemory((() =>
              {
                  return new MyClassLong();
              }));//16
              CaculateMemory((() =>
              {
                  return new MyClassByte();
              }));//12
          }
      }
      
      • Struct验证结果为1,空的struct是1,理论上是0,编译器实现为1,如果里面有了数据就是数据实际大小,不会多1。

      • Class就有意思了,空类为12,加了个int还是12,这让我十分困惑,但是有了Struct的经验,我又做了2个测试,当内部有个long的时候是16,多了4,也符合long和int的差值,那我加个3byte的话,就应该是11,和int差1(也可以加1个但是为了引出我接下来的测试就用3个byte),我试着打印了个byteclass的大小,结果也为12,再根据操作系统的内存对其的理论,我有个猜想,当然纯粹是笔者自己的设想没有验证过,当class为空类时,实际大小为9,内存对其后变成12,当class有值的时候,class大小为8,至于为什么为8?其实真正的情况是一个引用类型创建的时候会附带一个类型指针,和一个同步块索引的指针,这部分是在CLR中实现的,在32位系统下一个指针4字节,所以大小是8,内存对其按4字节对齐

      • 那我又有一个想法,C++中的Struct属性排列方式会影响struct的内存大小,在C+中是否还存在?

        public struct MyStructA
        {
            private int a;
            private long b;
            private char c;
        }
        public struct MyStructB
        {
            private int a;
            private char c;
            private long b;
        }
        
        static class Program
        {
            static void Main()
            {
                Console.WriteLine(Marshal.SizeOf(new MyStructA()));//24
                Console.WriteLine(Marshal.SizeOf(new MyStructB()));//16
            }
        }
        

        事实证明属性的排布对于Struct的影响还是存在的,具体关于struct内存的详细解析可以看(C++的内存管理),这里就不复述了,这里面写得挺详细的

    • C++中默认的operator new底层调用的是malloc,在分配内存时会带上上下cookie用于内存回收和内存碎片合并,现在到了C#中,因为C#有独有的垃圾回收机制,那我就比较好奇C#中对于对象内存的排列是怎么样的,还有没有上下cookie存在呢?所以我进行了下面的测试

      public class MyClassInt
      {
          private long a;
      }
      
      public class MyClassLong
      {
          private int a;
      }
      
      static class Program
      {
          for (int i = 0; i < 3; i++)
          {
              printMemory(new MyClassInt());
          }
          Console.WriteLine();
          for (int i = 0; i < 3; i++)
          {
              printMemory(new MyClassLong());
          }
      
          public static void printMemory(object o) // 获取引用类型的内存地址方法  
          {
              GCHandle h = GCHandle.Alloc(o, GCHandleType.WeakTrackResurrection);
      
              IntPtr addr = GCHandle.ToIntPtr(h);
      
              Console.WriteLine("0x" + addr.ToString("X"));
          }
          /*
          输出
          0xF010F8
          0xF010F4
          0xF010F0
      
          0xF010EC
          0xF010E8
          0xF010E4
          */
      }
      

      起初对于MyClassInt的输出我很惊讶,因为int的size刚好是4,我本来认为是C#对于内存分配器进行了特殊的管理,比如类似gunc的pool_alloc这样的设计,去掉了cookie,使得对象的大小就是纯粹的size大小间隔,结果想想不太对劲,还是不能靠猜,在试试其他的,一试就试出来了。。。换成了long以后按推理方式来说应该是间隔8,才是纯粹的size大小,结果一看并不是,还是4...fuck,所以其实这个C#中通过new内存并没有带上对象的地址,所以可以看出来打印的应该是引用的地址段,每个地址段4字节,没有cookie,至于指针指向的地方有没有cookie?不得而知,不过这里可以看出这这这样的设计和C#的垃圾回收器有很大关系。且还有个好玩的点,不同类型的内存地址也是连续的,用的是一同一个地址段。接下来再进行一个测试:

      for (int i = 0; i < 100000; i++)
      {
          printMemory(new MyClassInt());
      }
      /*
      其他代码不变
      0x12F10F8
      0x12F10F4
      0x12F10F0
      ...
      0x12F1000
      0x12F14FC
      0x12F14F8
      0x12F14F4
      ...
      0x12F1400
      0x12F15FC
      0x12F15F8
      ...
      0x12FFF08
      0x12FFF04
      0x12FFF00
      0x31E10FC
      0x31E10F8
      0x31E10F4
      ...
      0x31EFF00
      0x31F10FC
      ...
      0x31FFF00
      0x57E10FC
      */
      

      这里我想知道一次分配器分配的大小是多少,不够的时候是什么时候要新的内存块?所以我进行了这个测试,测试下来结果我总结了一下:

      • 首先先是开始的时候总是以XXXXF8开始的,十进制是248

      • 然后新分配的内存会递减这个内存段,直到变成00

      • 变成00后会去要当前这个地址段前三位(F10)后最近的可用的地址段,比如当前是F10就去看看F11可用吗,不行就找F12,依次,比如例中找到了F10用完找到了F14,F14用完找F15依次内推

      • 找到后分配的大小是从FC开始,252,对比于256差了4,很可能用了这个4记录了这个内存块用于GC的信息,比如这个内存块的引用计数。

      • 然后当倒数第五到第三这两位也用完后(变为FFF),那就会分配新的地址段,也是递增搜寻。所以新地址是31E,默认从E10FC开始(921836),结束是FFF00(1048320),可用126484,每个对象为4的话就是31621个对对象

    • 继续探索,如果想要继续往下的话就得去深挖看看GCHandle.Alloc的分配

      • 如果深入研究GCHandle.Alloc,您会看到它调用了一个本地方法InternalAlloc

        [System.Security.SecurityCritical]  // auto-generated
        [MethodImplAttribute(MethodImplOptions.InternalCall)]
        [ResourceExposure(ResourceScope.None)]
        internal static extern IntPtr InternalAlloc(Object value, GCHandleType type);
        

        其中InternalAlloc是CLR公共库的代码,其中就有这里核心的一个部分,CLR 垃圾回收器

        其中InternalAlloc的核心就是这一句:hnd = GetAppDomain()->CreateTypedHandle(objRef, type);

        依次调用ObjectHandle::CreateTypedHandle-> HandleTable::HndCreateHandle-> HandleTableCache->TableAllocSingleHandleFromCache,如果缓存堆中存在则返回,不存在则分配,这里方法调用的时候我已经new了这个对象了,所以对象是存在的,存在会返回这个对象的IntPtr。在托管堆中发生的唯一分配是IntPtr,它保存指向表中地址的指针。所以我疯狂print的都是这个指针的地址,所以我探究的也是这个intPtr的分配策略,当我明白这一点的时候,我就发现,诶嘿,我又可以水一篇C#GC探索的文章了,所以我跟到了CLR的库,开始研究CLR的GC原理,看看没有官方的解释和源码来论证我上述的猜想,所以...下期再见~

    • 什么是GC

      • GC如其名,就是垃圾收集,当然这里仅就内存而言。Garbage Collector(垃圾收集器,在不至于混淆的情况下也成为GC)以应用程序的root为基础,遍历应用程序在Heap上动态分配的所有对象,通过识别它们是否被引用来确定哪些对象是已经死亡的、哪些仍需要被使用。已经不再被应用程序的root或者别的对象所引用的对象就是已经死亡的对象,即所谓的垃圾,需要被回收。这就是GC工作的原理。为了实现这个原理,GC有多种算法。比较常见的算法有:
        • 引用计数法(Reference Counting)
        • 标记-清除(Mark-Sweep)
        • 标记-压缩(Mark-Compact)
        • 复制收集法(Copy Collection)
        • ...
        • 目前主流的虚拟系统.NET CLR,Java VM和Rotor都是采用的标记-清除+标记-压缩+复制收集法算法。
    • CLR的垃圾回收实现

      • Mark-Compact 标记压缩算法

        • 阶段1: Mark-Sweep 标记清除阶段,先假设heap中所有对象都可以回收,然后找出不能回收的对象,给这些对象打上标记,最后heap中没有打标记的对象都是可以被回收的

        • 阶段2: Compact 压缩阶段,对象回收之后heap内存空间变得不连续,在heap中移动这些对象,使他们重新从heap基地址开始连续排列,类似于磁盘空间的碎片整理。

          img

        • Heap内存经过回收、压缩之后,可以继续采用前面的heap内存分配方法,即仅用一个指针记录heap分配的起始地址就可以。主要处理步骤:将线程挂起→确定roots→创建reachable objects graph→对象回收→heap压缩→指针修复。可以这样理解roots:heap中对象的引用关系错综复杂(交叉引用、循环引用),形成复杂的graph,roots是CLR在heap之外可以找到的各种入口点。

        • GC搜索roots的地方包括全局对象、静态变量、局部对象、函数调用参数、当前CPU寄存器中的对象指针(还有finalization(析构) queue)等。主要可以归为2种类型:已经初始化了的静态变量、线程仍在使用的对象(stack+CPU register) 。 Reachable(可达) objects:指根据对象引用关系,从roots出发可以到达的对象。例如当前执行函数的局部变量对象A是一个root object,他的成员变量引用了对象B,则B是一个reachable object。从roots出发将可达对象全部标记完毕,剩余对象即为不可达对象,可以被回收 。

        • GC roots这组引用是tracing GC的 起点。要实现语义正确的tracing GC,就必须要能完整枚举出 所有的GC roots,否则就可能会漏扫描应该存活的对象,导致GC错误回收了这些被漏扫的活对象。

        • 指针修复是因为压缩过程移动了heap对象,对象地址发生变化,需要修复所有引用指针,包括stack、CPU register中的指针以及heap中其他对象的引用指针。Debug和release执行模式之间稍有区别,release模式下后续代码没有引用的对象是unreachable的,而debug模式下需要等到当前函数执行完毕,这些对象才会成为unreachable,目的是为了调试时跟踪局部对象的内容。传给了COM+的托管对象也会成为root,并且具有一个引用计数器以兼容COM+的内存管理机制,引用计数器为0时,这些对象才可能成为被回收对象。Pinned objects指分配之后不能移动位置的对象,例如传递给非托管代码的对象(或者使用了fixed关键字),GC在指针修复时无法修改非托管代码中的引用指针,因此将这些对象移动将发生异常。pinned objects会导致heap出现碎片,但大部分情况来说传给非托管代码的对象应当在GC时能够被回收掉。

      • Generational 分代算法

        • 程序可能使用几百M、几G的内存,对这样的内存区域进行GC操作成本很高,分代算法具备一定统计学基础,对GC的性能改善效果比较明显。将对象按照生命周期分成新的、老的,根据统计分布规律所反映的结果,可以对新、老区域采用不同的回收策略和算法,加强对新区域的回收处理力度,争取在较短时间间隔、较小的内存区域内,以较低成本将执行路径上大量新近抛弃不再使用的局部对象及时回收掉。分代算法的假设前提条件:

          ​ 1、大量新创建的对象生命周期都比较短,而较老的对象生命周期会更长

           2、对部分内存进行回收比基于全部内存的回收操作要快

           3、新创建的对象之间关联程度通常较强。heap分配的对象是连续的,关联度较强有利于提高CPU cache的命中率,.NET将heap分成3个代龄区域: Gen 0、Gen 1、Gen 2

          img

          • Heap分为3个代龄区域,相应的GC有3种方式: # Gen 0 collections, # Gen 1 collections, #Gen 2 collections。如果Gen 0 heap内存达到阀值,则触发0代GC,0代GC后Gen 0中幸存的对象进入Gen1。如果Gen 1的内存达到阀值,则进行1代GC,1代GC将Gen 0 heap和Gen 1 heap一起进行回收,幸存的对象进入Gen2。

          • 2代GC将Gen 0 heap、Gen 1 heap和Gen 2 heap一起回收,Gen 0和Gen 1比较小,这两个代龄加起来总是保持在16M左右;Gen2的大小由应用程序确定,可能达到几G,因此0代和1代GC的成本非常低,2代GC称为full GC,通常成本很高。粗略的计算0代和1代GC应当能在几毫秒到几十毫秒之间完成,Gen 2 heap比较大时,full GC可能需要花费几秒时间。大致上来讲.NET应用运行期间,2代、1代和0代GC的频率应当大致为1:10:100。

      • Finalization Queue(析构队列)和Freachable Queue(可达队列)

        • 这两个队列和.NET对象所提供的析构方法有关。这两个队列并不用于存储真正的对象,而是存储一组指向对象的指针。当程序中使用了new操作符在Managed Heap上分配空间时,GC会对其进行分析,如果该对象含有析构方法则在析构队列中添加一个指向该对象的指针
        • 在GC被启动以后,经过Mark阶段分辨出哪些是垃圾。再在垃圾中搜索,如果发现垃圾中有被析构队列中的指针所指向的对象,则将这个对象从垃圾中分离出来,并将指向它的指针移动到Freachable Queue(终结队列)中。这个过程被称为是对象的复生(Resurrection),本来死去的对象就这样被救活了。为什么要救活它呢?因为这个对象的析构方法还没有被执行,所以不能让它死去。Freachable Queue平时不做什么事,但是一旦里面被添加了指针之后,它就会去触发所指对象的析构方法执行,之后将这个指针从队列中剔除,这是对象就可以安静的死去了。
        • .NET Framework的System.GC类提供了控制析构的两个方法,ReRegisterForFinalize和SuppressFinalize。前者是请求系统完成对象的Finalize方法,后者是请求系统不要完成对象的Finalize方法。ReRegisterForFinalize方法其实就是将指向对象的指针重新添加到Finalization Queue中。这就出现了一个很有趣的现象,因为在析构队列中的对象可以复生,如果在对象的Finalize方法中调用ReRegisterForFinalize方法,这样就形成了一个在堆上永远不会死去的对象,像凤凰涅槃一样每次死的时候都可以复生。
      • 托管资源:

        • .NET中的所有类型都是(直接或间接)从System.Object类型派生的。

          • CTS中的类型被分成两大类——引用类型(reference type,又叫托管类型[managed type]),分配在内存堆上;值类型(value type),分配在堆栈上。如图:

          img

          • 值类型在栈里,先进后出,值类型变量的生命有先后顺序,这个确保了值类型变量在退出作用域以前会释放资源。比引用类型更简单和高效。堆栈是从高地址往低地址分配内存。

          • 引用类型分配在托管堆(Managed Heap)上,声明一个变量在栈上保存,当使用new创建对象时,会把对象的地址存储在这个变量里。托管堆相反,从低地址往高地址分配内存。

      • 非托管资源:

          ApplicationContext, Brush, Component, ComponentDesigner, Container, Context, Cursor, FileStream, Font, Icon, Image, Matrix, Object, OdbcDataReader, OleDBDataReader, Pen, Regex, Socket, StreamWriter, Timer, Tooltip, 文件句柄, GDI资源, 数据库连接等等资源。可能在使用的时候很多都没有注意到!

    • .NET的GC机制有这样两个问题:

      • GC并不是能释放所有的资源。它不能自动释放非托管资源。
      • GC并不是实时性的,这将会造成系统性能上的瓶颈和不确定性。
        • GC并不是实时性的,这会造成系统性能上的瓶颈和不确定性。所以有了IDisposable接口,IDisposable接口定义了Dispose方法,这个方法用来供程序员显式调用以释放非托管资源。使用using语句可以简化资源管理。当你用Dispose方法释放未托管对象的时候,应该调用GC.SuppressFinalize。如果对象正在终结队列(finalization queue), GC.SuppressFinalize会阻止GC调用Finalize方法。因为Finalize方法的调用会牺牲部分性能。如果你的Dispose方法已经对委托管资源作了清理,就没必要让GC再调用对象的Finalize方法(MSDN)
    • GC注意事项:

      • 只管理内存,非托管资源,如文件句柄,GDI资源,数据库连接等还需要用户去管理。
      • 循环引用,网状结构等的实现会变得简单。GC的标志-压缩算法能有效的检测这些关系,并将不再被引用的网状结构整体删除。
      • GC通过从程序的根对象开始遍历来检测一个对象是否可被其他对象访问,而不是用类似于COM中的引用计数方法。
      • GC在一个独立的线程中运行来删除不再被引用的内存。
      • GC每次运行时会压缩托管堆。
      • 你必须对非托管资源的释放负责。可以通过在类型中定义Finalizer来保证资源得到释放。
      • 对象的Finalizer(析构)被执行的时间是在对象不再被引用后的某个不确定的时间。注意并非和C++中一样在对象超出声明周期时立即执行析构函数
      • Finalizer的使用有性能上的代价。需要Finalization的对象不会立即被清除,而需要先执行Finalizer.Finalizer,不是在GC执行的线程被调用。GC把每一个需要执行Finalizer的对象放到一个队列中去,然后启动另一个线程来执行所有这些Finalizer,而GC线程继续去删除其他待回收的对象。在下一个GC周期,这些执行完Finalizer的对象的内存才会被回收。
      • .NET GC使用"代"(generations)的概念来优化性能。代帮助GC更迅速的识别那些最可能成为垃圾的对象。在上次执行完垃圾回收后新创建的对象为第0代对象。经历了一次GC周期的对象为第1代对象。经历了两次或更多的GC周期的对象为第2代对象。代的作用是为了区分局部变量和需要在应用程序生存周期中一直存活的对象。大部分第0代对象是局部变量。成员变量和全局变量很快变成第1代对象并最终成为第2代对象。
      • GC对不同代的对象执行不同的检查策略以优化性能。每个GC周期都会检查第0代对象。大约1/10的GC周期检查第0代和第1代对象。大约1/100的GC周期检查所有的对象。重新思考Finalization的代价:需要Finalization的对象可能比不需要Finalization在内存中停留额外9个GC周期。如果此时它还没有被Finalize,就变成第2代对象,从而在内存中停留更长时间。
    • 栈区:由编译器自动分配释放 ,存放值类型的对象本身,引用类型的引用地址(指针),静态区对象的引用地址(指针),常量区对象的引用地址(指针)等。其操作方式类似于数据结构中的栈。
    • 堆区(托管堆):用于存放引用类型对象本身。在c#中由.net平台的垃圾回收机制(GC)管理。栈,堆都属于动态存储区,可以实现动态分配。
    • 静态区及常量区:用于存放静态类,静态成员(静态变量,静态方法),常量的对象本身。由于存在栈内的引用地址都在程序运行开始最先入栈,因此静态区和常量区内的对象的生命周期会持续到程序运行结束时,届时静态区内和常量区内对象才会被释放和回收(编译器自动释放)。所以应限制使用静态类,静态成员(静态变量,静态方法),常量,否则程序负荷高.
    • 代码区:存放函数体内的二进制代码。

参考资料

posted @ 2021-02-03 12:38  陌冉  阅读(302)  评论(0编辑  收藏  举报