关于C#理解装箱与拆箱
1.理解装箱
简单地说,装箱就是将一个值类型的数据存储在一个引用类型的变量中。
假设你一个方法中创建了一个 int 类型的本地变量,你要将这个值类型表示为一个引用类型,那么就表示你对这个值进行了装箱操作,如下所示:
static void SimpleBox() { int myInt = 25; // 装箱操作 object boxedInt = myInt; }
确切地说,装箱的过程就是将一个值类型分配给 Object 类型变量的过程。当你装箱一个值时,CoreCLR 会在堆上分配一个新的对象,并将该值类型的值复制到该对象实例。返回给你的是一个在托管堆中新分配的对象的引用。
2.理解拆箱
反过来,将 Object
引用类型变量的值转换回栈中相应的值类型的过程则称为拆箱。
从语法上讲,拆箱操作看起来就像一个正常的转换操作。然而,其语义是完全不同的。CoreCLR
首先验证接收的数据类型是否等同于被装箱的类型,如果是,它就把值复制回基于栈存储的本地变量中。
例如,如果下面的 boxedInt
的底层类型确实是 int
,那就完成了拆箱操作:
static void SimpleBoxUnbox() { int myInt = 25; // 装箱操作 object boxedInt = myInt; // 拆箱操作 int unboxedInt = (int)boxedInt; }
记住,与执行典型的类型转换不同,你必须将其拆箱到一个恰当的数据类型中。如果你试图将一块数据拆箱到不正确的数据类型中,将会抛出InvalidCastException
异常。
为了安全起见,如果你不能保证Object
类型背后的类型,最好使用 try/catch 逻辑把拆箱操作包起来,尽管这样会有些麻烦。考虑下面的代码,它将抛出一个错误,因为你正试图将装箱的int 类型
拆箱成一个long 类型
:
static void SimpleBoxUnbox() { int myInt = 25; // 装箱操作 object boxedInt = myInt; // 拆箱到错误的数据类型,将触发运行时异常 try { long unboxedLong = (long)boxedInt; } catch (InvalidCastException ex) { Console.WriteLine(ex.Message); } }
3.生成的 IL 代码
当 C# 编译器遇到装箱/拆箱语法时,它会生成包含装箱/拆箱操作的 IL 代码。如果你用 ildasm.exe 查看编译的程序集,你会看到装箱和拆箱操作对应的 box
和 unbox
指令:
.method assembly hidebysig static void '<<Main>$>g__SimpleBoxUnbox|0_0'() cil managed { .maxstack 1 .locals init (int32 V_0, object V_1, int32 V_2) IL_0000: nop IL_0001: ldc.i4.s 25 IL_0003: stloc.0 IL_0004: ldloc.0 IL_0005: box [System.Runtime]System.Int32 IL_000a: stloc.1 IL_000b: ldloc.1 IL_000c: unbox.any [System.Runtime]System.Int32 IL_0011: stloc.2 IL_0012: ret } // end of method '<Program>$'::'<<Main>$>g__SimpleBoxUnbox|0_0'
乍一看,装箱/拆箱似乎是一个没啥用的语言特性,学术性大于实用性。毕竟,你很少需要在一个本地 Object 变量中存储一个本地值类型。然而,事实是装箱/解箱过程是相当有用的,因为它允许你假设一切都可以被当作 Object 类型来处理,而 CoreCLR 会自动帮你处理与内存有关的细节。
4.实际应用
让我们来看看装箱/拆箱的实际应用,我们以 C# 的 ArrayList 类为例,用它来保存一批在栈中存储的整型数据。ArrayList 类的相关方法成员列举如下:
public class ArrayList : IList, ICloneable { ... public virtual int Add(object? value); public virtual void Insert(int index, object? value); public virtual void Remove(object? obj); public virtual object? this[int index] { get; set; } }
请注意,上面 ArrayList 的方法都是对 Object 类型数据进行操作。ArrayList 是为操作对象(代表任何类型)而设计的,而对象是在托管堆上分配的数据。请考虑下面代码:
static void WorkWithArrayList() { // 当传递给对象的方法时,值类型会自动被装箱 ArrayList myInts = new ArrayList(); myInts.Add(10); }
尽管你直接将数字数据传入需要 Object 参数的方法中,但运行时自动将分配在栈中的数据装箱。如果你想使用索引器从 ArrayList 中检索一条数据,你必须使用转换操作将堆分配的对象拆箱为栈分配的整型,因为 ArrayList 的索引器返回的是 Object 类型,而不是 int 类型。
static void WorkWithArrayList() { // 当传递给需要对象参数的方法时,值类型就自动被装箱 ArrayList myInts = new ArrayList(); myInts.Add(10); // 当对象被转换回基于栈存储的数据时,就会发生拆箱 int i = (int)myInts[0]; // 由于 WriteLine() 需要的 object 参数,又重新装箱了 Console.WriteLine("Value of your int: {0}", i); }
在调用 ArrayList.Add()
之前,在栈中分配的 int 数值被装箱了,所以它可以被传入参数为 Object
类型的方法中。从 ArrayList
中检索到 Object
类型的数据时,通过转换操作,它就被拆箱成 int 类型。最后,当它被传递给 Console.WriteLine()
方法时,又被装箱了,因为这个方法的参数是 Object
类型。
5.小结
从程序员的角度来看,装箱和拆箱是很方便的,我们不需要手动去复制和转移内存中的值类型和引用类型的数据。
但装箱和拆箱背后的栈/堆内存转移也带来了性能问题。下面总结一下对一个简单的整型数进行装箱和拆箱所需要的步骤:
在托管堆中分配一个新对象;
在栈中的数据值被转移到该托管堆中的对象上;
当拆箱时,存储在堆中对象上的值被转移回栈中;
堆上未使用的对象将最终被 GC 回收。
尽管很多时候装箱和拆箱操作不会在性能方面造成重大影响,但如果一个像 ArrayList 这样的集合包含成千上万条数据,而你的程序又会频繁操作这些数据,性能的影响还是会很明显的。
所以,我们平时在编程时应当尽量避免发生装箱和拆箱操作。比如对于上面 ArrayList 的示例,如果集合元素类型是一致的,则应当使用泛型的集合类型,比如改用 List、LinkedList 等。