值类型和引用类型的区别
似乎“值类型和引用类型的区别”是今年面试的流行趋势,我已然是连续三次(目前总共也就三次)面试第一个问题就遇到这个了,这是多大的概率啊,100%,哈哈,我该买彩票去!
言归正传,咱还是先来探讨探讨这二者之间有什么区别吧。记得有一次电话面试中,我直接跟面试官说:“值类型是现金,引用类型是存折”,后来想想当时说这话虽是有点儿冲动地脱口而出,但也没什么不妥。我这人不善于背理论的教条,喜欢把书本上那些生硬的话跟现实生活中常见的事物联系起来理解和记忆。
直白点儿说:值类型就是现金,要用直接用;引用类型是存折,要用还得先去银行取现。
声明一个值类型变量,编译器会在栈上分配一个空间,这个空间对应着该值类型变量,空间里存储的就是该变量的值。引用类型的实例分配在堆上,新建一个引用类型实例,得到的变量值对应的是该实例的内存分配地址,这就像您的银行账号一样。具体哪些类型是值类型哪些是引用类型,大家翻翻书,背一背就好了,不过我想,做过一段时间的开发,即使您背不了书上教条的定义,也不会把值类型和引用类型搞混的。接下来,还是老规矩,咱看码说话吧。
1: public class Person
2: {
3: public string Name { get; set; }
4: public int Age { get; set; }
5: }
6:
7: public static class ReferenceAndValue
8: {
9: public static void Demonstration()
10: {
11: Person zerocool = new Person { Name = "ZeroCool", Age = 25 };
12: Person anders = new Person { Name = "Anders", Age = 47 };
13:
14: int age = zerocool.Age;
15: zerocool.Age = 22;
16:
17: Person guru = anders;
18: anders.Name = "Anders Hejlsberg";
19:
20: Console.WriteLine("zerocool's age:\t{0}", zerocool.Age);
21: Console.WriteLine("age's value:\t{0}", age);
22: Console.WriteLine("anders' name:\t{0}", anders.Name);
23: Console.WriteLine("guru' name:\t{0}", guru.Name);
24: }
25: }
上面这段代码,我们首先创建了一个Person类,包含了Name和Age两个属性,毋庸置疑,Person类是引用类型,Name也是,因为它是string类型的(但string是很特殊的引用类型,后面将专门有一篇文章来讨论),但Age则是值类型。接下来我们来看看Demonstration方法,其中演示的就是值类型跟引用类型的区别。
首先,我们声明了两个Person类的实例对象,zerocool和anders,前面提到过,这两个对象都被分配在堆上,而zerocool和anders本身其实只是对象所在内存区域的起始地址引用,换句话说就是指向这里的指针。我们声明对象实例时也顺便分别进行了初始化,首先我们看,zerocool对象的值类型成员,我们赋值为25(对,我今年25岁),anders(待会儿你们就知道是谁了)的Name属性,我们赋值为“Anders”。齐活儿,接下来看我们怎么干吧。
我们声明一个值类型变量age,直接在初始化时把zerocool的Age值赋给它,显然,age的值就是25了。但这个时候zerocool不高兴了,他想装嫩,私自把自己的年龄改成22岁,刚够法定结婚年龄。然后我们又声明了一个引用类型的guy对象,初始化时就把anders赋给它,然后anders露出庐山真面目了,他的名字叫“Anders Hejlsberg”(在此向C#之父致敬)。接下来我们来分别答应出这几个变量的值,看看有什么差别。
你可能要觉得奇怪(你要不觉得奇怪,也就不用再接着往下看了),为什么我们改了zerocool.Age的值,age没跟着变,改了anders.Name的值,guru.Name却跟着变了呢?这就是值类型和引用类型的区别。我们声明age值类型变量,并将zerocool.Age赋给它,编译器在栈上分配了一块空间,然后把zerocool.Age的值填进去,仅此而已,二者并无任何牵连,就像复印机一样,只是把zerocool.Age的值拷贝给age了。而引用类型不一样,我们在声明guy的时候把anders赋给它,前面说过,引用类型包含的是只想堆上数据区域地址的引用,其实就是把anders的引用也赋给guy了,因此这二者从此指向了同一块内存区域,既然是指向同一块区域,那么甭管谁动了里面的“奶酪”,另一个变现出来的结果也会跟着变,就像信用卡跟亲情卡一样,用亲情卡取了钱,与之关联的信用卡账上也会跟着发生变化。一提到钱,估计大家伙儿印象就深了些吧,呵呵!
另外,性能上也会有区别的。既然一个是直接操作内存,另一个则多一步先解析引用地址,那么显然很多时候值类型会减小系统性能开销。但“很多时候”不代表“所有时候”,有些时候还得量力而为,例如需要大量进行函数参数传递或返回的时候,老是这样进行字段拷贝,其实反而会降低应用程序性能。另外,如果实例会被频繁地用于Hashtable或者ArrayList之类的集合中,这些类会对其中的值类型变量进行装箱操作,这也会导致额外的内存分配和内存拷贝操作,从应用程序性能方面来看,其实也不划算。
哦对了,上面提到了一个概念,装箱。那么什么是装箱呢?其实装箱就是值类型到引用类型的转化过程。将一个值类型变量装箱成一个引用类型变量,首先会在托管堆上为新的引用类型变量分配内存空间,然后将值类型变量拷贝到托管堆上新分配的对象内存中,最后返回新分配的对象内存地址。装箱操作是可逆的,所以还有拆箱操作。拆箱操作获取指向对象中包含值类型部分的指针,然后由程序员手动将其对应的值拷贝给值类型变量。接下来我们来看看典型的装箱和拆箱操作。
1: public static class BoxingAndUnboxing
2: {
3: public static void Demonstration()
4: {
5: int ageInt = new int();
6:
7: // Boxing operation.
8: object ageObject = ageInt;
9:
10: //ageObject = null;
11:
12: // Unboxing operation.
13: ageInt = (int)ageObject;
14:
15: Console.WriteLine(ageInt);
16: }
17: }
在该方法中,我们首先声明了一个值类型变量ageInt,但并未给它赋值,接着声明了一个典型的引用类型变量ageObject,并把ageInt赋给它,这里就进行了一次装箱操作。编译器现在托管堆上分配一块内存空间(空间大小为对象中包含的值类型变量所占空间总和外加一个方法表指针和一个SyncBlockIndex),然后把ageInt拷贝到这个空间中,再返回该空间的引用地址。接下来第13行则是拆箱操作,编译器获取到ageObject对象中值类型变量的指针,然后将其值拷贝给值类型变量。如果你把第10行注释掉的代码打开(这是通俗说法,其实就是取消注释),那么第13行就会抛出System.NullReferenceException异常,要说问什么,这又会牵扯出值类型跟引用类型另一个大的不同。看见了吧,声明ageInt时并没有赋值,如果关掉第10行代码,程序不会报错,最后打印出个0,这说明在声明值类型变量时,如果没有初始化赋值,编译器会自动将其赋值为0,既然值类型没有引用,那么它就不可能为空。引用类型不一样,它可以为空引用,一张过期作废的银行卡是可以存在。而如果将一个空的对象拆箱,编译器上哪儿去找它里面的值类型变量的指针呢?所以这也是拆箱操作需要注意的地方。
最后,我们在把值类型和引用类型之间其它一些明显区别大致罗列如下,以便大家能顺利通过面试第一问。
- 所有值类型都继承自System.ValueType,但是ValueType没有附加System.Object包含之外其它任何方法,不过它倒是改写了Equals和GetHashCode两个方法。引用类型变量的Equals比较的是二者的引用地址而不是内部的值,值类型变量的Equals方法比较的是二者的值而不是……哦对了,值类型压根儿没有引用地址;
- 值类型不能作为其它任何类型的基类型,因此不能向值类型中增加任何新的虚方法,更不该有任何抽象方法,所有的方法都是sealed的(不可重写);
- 未装箱的值类型分配在栈上而不是堆上,而栈又不是GC的地盘儿,因此GC根本不过问值类型变量的死活,一旦值类型变量的作用范围一过,它所占的内存空间就立即被回收掉,不劳GC亲自动手。
以上罗列的都是值类型和引用类型之间的主要区别,文码并茂,相信应该给你留下比较深刻的印象,虽不够深,但愿能起到抛砖引玉的作用。如果去面SDE职位,估计这深度就差不多了,我这文章不是面向那些要去面Senior SDE甚至Dev Lead的正神,咱这儿庙小,嘿嘿!
--------------------------------------------------------------------------------------------------------------------------------------------
.NET将数据类型分为值类型(value type)和引用类型(reference type)
一个具有值类型(value type)的数据存放在栈内的一个变量中。即是在栈中分配内存空间,直接存储所包含的值,其值就代表数据本身。值类型的数据具有较快的存取速度。
一个具有引用类型(reference type)的数据并不驻留在栈中,而是存储于堆中。即是在堆中分配内存空间,不直接存储所包含的值,而是指向所要存储的值,其值代表的是所指向的地址。当访问一个具有引用类型的数据时,需要到栈中检查变量的内容,该变量引用堆中的一个实际数据。引用类型的数据比值类型的数据具有更大的存储规模和较低的访问速度。
C#是一种类型安全的语言。每一个变量都要求定义为一个特定的类型,并且要求存储在变量中的值只能是这种类型的值。
变量既能保存值类型,也可以保存引用类型,还可以是指针。这一课将讲述前两种类型,关于指针的讨论我们将在下一课中进行。
下面是关于值类型和引用类型不同点的概论:
如果一个变量v存储的是值类型,则它直接存储包含数据的对象。任何其他的变量v’都不能直接存储已经由v存储了的对象,虽然v’可以存储一个和v存储的对象有着相同值的对象。(译注:这意味着,v和v’存储的对象毫不相干,任意改变其中一个存储的对象都不会影响到另一个变量存储的对象。)
如果变量v存储的是一个引用类型,它直接存储一个指向对象的引用,同时可能存在另一个变量v’,它也存储着指向这个对象的引用。(译注:这意味着,改变v’引用的对象同时也会影响到v引用的对象,反之亦然。)
值类型
在C#中你可以通过声明枚举类型或是结构类型来定义你自己的值类型。C#以同样的方式处理用户自定义的类型和C#预定义的值类型,不过C#编译器可能更优于处理后者。下面的表列出了C#中预定义的值类型的一些信息。因为在C#中所有的基本值类型都是从object类型(最终基类)发展而来,所以下表中还显示了与这些预定义类型相对应的.Net框架中的System类型。
C# 类型 |
.Net 框架类型 |
有无符号 |
占据位数 |
取值范围 |
sbyte |
System.Sbyte |
是 |
1 |
-128 到 127 |
short |
System.Int16 |
是 |
2 |
-32768 到32767 |
int |
System.Int32 |
是 |
4 |
-2147483648 到 2147483647 |
long |
System.Int64 |
是 |
8 |
-9223372036854775808 到 9223372036854775807 |
byte |
System.Byte |
否 |
1 |
0 到 255 |
ushort |
System.Uint16 |
否 |
2 |
0 到 65535 |
uint |
System.UInt32 |
否 |
4 |
0 到 4294967295 |
ulong |
System.Uint64 |
否 |
8 |
0 到18446744073709551615 |
float |
System.Single |
是 |
4 |
可能值从 ±1.5 x 10-45 到 ±3.4 x 1038 ,小数点后7位有效数字 |
double |
System.Double |
是 |
8 |
可能值从 ±5.0 x 10-324 to ±1.7 x 10308 小数点后15到16位有效数字 |
decimal |
System.Decimal |
是 |
12 |
可能值从 ±1.0 x 10-28 到±7.9 x 1028 小数点后28到29位有效数字 |
char |
System.Char |
N/A |
2 |
任何16位Unicode字符 |
bool |
System.Boolean |
N/A |
1 / 2 |
true 或者false |
在下面的代码中,两个变量都声明为整形,并得到赋值:
int x = 10;
int y = x;
y = 20; // 这条语句运行后x的值为10,y的值为20;
引用类型
C#预定义的引用类型包括object和string类型。正如我们在上面提到的,object类型是所有其他类型的最终基类。用户定义的引用类型可以是接口类型、类类型和委托类型(第12课会有具体介绍)。
引用类型事实上保存一个指向它引用的对象的内存地址。下面的代码段中有两个变量引用了同一个对象(本例中,假设这个对象有一个数据成员’myValue’):
object x = new object();
x.myValue = 10;
object y = x;
y.myValue = 20; // 这条语句执行后,x.myValue和y.myValue的值都为20。
上面的这段代码演示了引用类型的一个特点:改变某一个引用指向的对象的属性同时也会影响到所有其他指向这个对象的引用。不过,strings类型虽然也是引用类型,但它的工作方式更象值类型。当一个字符串被指定了另一个字符串的值时,例如:
string s1 = "hello";
string s2 = s1;
s2和s1都引用了同一个字符串类型,但是当s1的值发生改变时,例如s1=”goodbye”;s2的值仍然是”hello”。之所以会这样,是因为当改变s1的值是,新创建了一个string对象,s1引用这个新的string对象;s2仍然引用原来string对象。产生这种行为的原因是string对象是恒定的,也就是说,一旦一个string对象被创建,它的值就不能再修改,所以当改变一个字符串变量的值的时候,仅仅是新创建了一个包含修改内容的新的string对象。
转义序列和逐字字符串(verbatim strings)
当声明一个字符串变量时有一些字符是不能以平常的方式包含在变量中的。为了解决这个问题,C#提供了两种不同的方法。
第一种方法是使用’转义序列’。例如,我们想得到如下的字符串
“Hello World
How are you”
我们可以使用下面的语句声明字符串:string a = "\"Hello World\nHow are you\""。这条语句中使用了”和换行符的转义序列。更多字符的转义序列可以参见下表:
Character |
Escape Sequence |
´ |
\´ |
" |
\" |
\ |
\\ |
警报 |
\a |
退格符 |
\b |
换页符 |
\f |
换行符 |
\n |
回车符 |
\r |
Tab 符 |
\t |
垂直 Tab 符 |
\v |
使用数字指定的Unicode 字符,如\u2000 |
\u |
使用十六进制数指定的Unicode 字符,如\xc8 |
\x |
空值 |
\0 (zero |
第二种方法是使用’逐字字符串’文本。这种方法将想要得到的字符串放在@”和”之间。假如我们需要将C:\My Documents\赋值给’path’,我们可以使用转义序列方法:string path = "C:\\My Documents\\";也可以使用如下的语句:string path = @"C:\MyDocuments\"。
通过使用后一种方法得到的字符串还可以横跨多行而不需要使用’\n’。使用这种方法唯一需要使用到转义序列的字符串是”,其转义字符为””(两个连在一起的双引号)。例如想将the word "big" contains three letters.赋值给’text’,我们就可以使用如下的语句:string text = @"the word ""big"" contains three letters."。
装箱
C#允许你将任何的值类型转换为对应的引用类型,也可以将得到的引用类型再转换为值类型。下面的代码演示了这种转换――装箱:
int i = 123;
object box = i;
if (box is int)
{Console.Write("Box contains an int");} // 这一行将会打印出来。
当第2行的代码执行后,对象’box’将被初始化,i保存的值将被复制给这个对象。值得注意的一件趣事是box运行时的类型将是被装箱的值类型(本例中即为int)。’is’操作符将返回box的类型为int。