(转)剖析Delphi中的构造和析构

剖析Delphi中的构造和析构

1 Delphi中的对象模型: 2
1.1 对象名表示什么？ 2
1.2 对象存储在哪里？ 2
1.3 对象中存储了什么？它们是如何存储的? 3
2 构造函数与创建对象 5
2.1 什么是构造函数？(“特殊的”类方法) 5
2.2 对象的创建的全过程 5
2.3构造函数另类用法(使用类引用实现构造函数的多态性) 6
3 析构函数与销毁对象 7
3.1 什么是析构函数(“天生的”虚方法) 7
3.2 对象销毁的全过程 7
3.3 destroy, free, freeAndNil, release用法和区别 7
4 VCL构造&析构体系结构 8
5 正确使用构造函数和析构函数 9

剖析Delphi中的构造和析构
摘要: 本文通过对VCL/RTL的研究,来剖析构造函数和析构函数的实现机制和VCL中对象的体系结构,并说明如何正确地创建和释放对象。
关键字: 构造，析构，创建对象，销毁对象，堆，栈，多态。
作者: majorsoft

问题
Delphi中构造函数和析构函数的实现机制是什么?和C 有何不同？如何做到正确地创建和释放对象？
解决思路
如何正确使用构造和析构是我们在使用Delphi过程中经常遇到的问题，在大富翁论坛中的Oriented Pascal栏目有不少相关帖子（详见相关问题），本人也曾遇到过类似的问题，下面通过对VCL/RTL源代码的研究，来理解构造函数和析构函数的实现机制。
1 Delphi中的对象模型:
1.1 对象名表示什么？
与C 不同，Delphi中的对象名(也可以称做变量)表示对象的引用，并不表示对象本身，相当于指向对象的指针,这就所谓的“对象引用模型”。如图所示:
Obj(对象名) 实际的对象

Vmt 入口地址

数据成员

图1对象名引用内存中的对象
1.2 对象存储在哪里？
每个应用程序将分配给其运行的内存分为四个区域：

代码区(Code area)
全局数据区(data area)
堆区(heap area)
栈区(stack area)

图2 程序内存空间
代码区：存储程序中程序代码，包括所有的函数代码
全局数据区：存储全局数据。
堆区：又叫“自由存储区”,存储动态数据（在Delphi中包括对象和字符串）。作用域为整个应用程序的整个生命周期直到调用了析构方法。
栈区：又叫“自动存储区”存储程序中的局部数据，在C 中，局部变量实际上是auto类型的变量。作用域为函数内部，函数调用完系统就立即回收栈空间。
在C 中，对象既可创建在堆(heap)上，也可以创建在栈(stack)中，还可以在全局数据中创建对象，故C 有全局对象、局部对象、静态对象和堆对象四种对象之说。而在Delphi中，所有的对象都是建立堆（heap）存储区上，所以Delphi构造函数不能自动被调用，而必须由程序员自己调用(在设计器拖动组件，此时对象由Delphi创建)。下面的程序说明Delphi和C 中创建对象的区别：
在Delphi中：
Procedure CreateObject(var FooObjRef:TFooObject);
begin
FooObjRef:=TfooObject.create;
//由程序员调用,过程调用完之后,对象依然存在.不需要进行拷贝
FooObject.caption=’I am created in stack of CreateObject()’;
End;
而在C 中：
TfooObject CreateObject（void）;
{
TfooObject FooObject;//创建局部对象
// static TfooObject FooObject;//创建静态局部对象
//对象自动调用默认的构造函数进行创建,对象此时在函数栈中创建
FooObject.caption=’I am created in stack of CreateObject()’;
return FooObject;
//返回的时候进行了对象拷贝,原来创建的对象随函数的调用结束后,自动销毁}
TfooObject fooObject2;//创建全局对象。
void main();
{ TFooObject* PfooObjec=new TfooObject;
//创建堆对象。函数调用完之后，对象依然存在，不需要进行拷贝。}
1.3 对象中存储了什么？它们是如何存储的?
与C 不同的是,Delphi中的对象只存储了数据成员和虚拟方法表(vmt)的入口地址，而没有存储方法，如图所示：
对象虚拟方法表代码段

Vmt地址
name:String
width:integer;
ch1:char;
…
Proc1
Func1
…
procn
funcn

…

图 3 对象的结构 …
也许你对上面的说法存在着些疑问，请看下面的程序:
TsizeAlignTest=class
private
i:integer;
ch1,ch2:char;
j:integer;
public
procedure showMsg;
procedure virtMtd; virtual;
end;

memo1.Lines.Add(inttostr(sizeTest.InstanceSize) '''':InstanceSize'''');
memo1.Lines.Add(inttostr(integer(sizeTest)) ''''<-start Addr'''');
memo1.Lines.Add(inttostr(integer(@(sizeTest.i))) ''''<-sizeTest.i'''');
memo1.Lines.Add(inttostr(integer(@(sizeTest.ch1))) ''''<-sizeTest.ch1'''');
memo1.Lines.Add(inttostr(integer(@(sizeTest.ch2))) ''''<-sizeTest.ch2'''');
memo1.Lines.Add(inttostr(integer(@(sizeTest.j))) ''''<-sizeTest.j'''');
结果显示:
16:InstanceSize
14630724<-start Addr
14630728<-sizeTest.i
14630732<-sizeTest.ch1
14630733<-sizeTest.ch2
14630736<-sizeTest.j
数据成员和vmt入口地址就占了16个字节!,两个成员函数showMsg, virtMtd在对象的存储区中根本没占空间。
那么成员函数到底存储在哪儿呢？由于Delphi是基于RTL(运行时类型库)的，所有的成员函数都在类中存储，成员函数实际上就是方法指针，它指向成员函数的入口地址，该类的所有对象共享这些成员函数。那么怎样找到成员函数的入口地址呢？对于静态函数，这个工作由编译器来完成的，在编译过程中，根据类对象引用/指针的类型，即直接在类来中找到成员函数的入口地址(此时并不需要对象存在)，这也就是所谓的静态绑定；而对于虚方法（包括动态方法），则是通过在运行时的对象的虚拟方法表vmt入口地址（即对象的前四个字节,此时对象一定要存在，否则就会导致指针访问出错），来找到成员函数的入口地址，这也就是所谓的动态绑定。

注意
上面提到，所有的成员函数都在类中存储，实际上也包括虚拟方法表Vmt。从Delphi的代码自动完成功能(它依赖于编译信息)可以看出，当我们在输入完对象名，再输入“.“之后，此时Delphi重新编译了一遍，列出所有的数据成员和所有的静态方法，所有的虚方法，所有的类方法，所有的构造函数和析构函数，大家可以动手试试看是不是这样的。

类虚方法表vmt入口地址
数据成员模板信息
静态方法表等
虚方法表vmt
对象

Vmt入口地址
数据成员

上面的程序还演示了对象数据成员的对齐方式(物理数据结构)，以4字节对齐（windows默认的对齐方式）,如下图所示：

Vmt Entrance Addr
i
Ch1 Ch2
j

2 构造函数与创建对象
2.1 什么是构造函数？(“特殊的”类方法)
从OO（面向对象）思想的语义上讲，构造函数负责对象的创建，但就OOP语言的实现上讲，无论Delphi还是C ，构造函数充其量只做了对象的初始化工作（包含调用内部子对象的构造函数），并没有负责创建对象的全过程（参考2.2）。
另外，与C 中不同的是，Delphi为构造函数定义了另一种方法类型(mkConstructor,参见Delphi安装目录下的\Source\RTL\Common\typInfo.pas,125行)，我们可以把它理解为 “特殊的”类方法。它只能通过类(类名/类引用/类指针)来调用，而一般的类方法既可以通过类也可以通过对象来调用；还有一点特殊就是构造函数中内置的self参数是指向对象的，而在类方法中self是指向类的，我们通常在其中对其数据成员进行初始化工作，使其成为真正意义上的对象，这都得益于self这个参数。
在默认情况下，构造函数是静态函数，我们可以把它设为虚方法，在其派生类中对其覆载（Override），这样可以实现构造函数的多态性（参见2.4），也可以对其进行重载(Overload)，创建多个构造函数，还可以在派生类直接覆盖(Overlay)父类的构造函数,这样在派生类屏蔽了父类的构造函数，在VCL中就采用了这些技术，形成一个构造&析构的“体系结构”（参见4）
2.2 对象的创建的全过程
对象的创建完整过程应该包括分配空间、构造物理数据结构、初始化、内部子对象的创建。上面提到，构造函数只是负责初始化工作以及调用内部子对象的构造函数，那么分配空间和构造物理结构是怎么完成的呢？这由于编译器在做了额外的事情，我们不知道而已。编译到构造函数时，会构造函数之前，会在插入一行“call @ClassCreate”汇编代码,它实际上就是system 单元中的_ClassCreate函数，下面看看_ClassCreate函数的部分源码：
function _ClassCreate(AClass: TClass; Alloc: Boolean): TObject;
asm
{ -> EAX = pointer to VMT }
{ <- EAX = pointer to instance }
…
CALL dword ptr [EAX].vmtNewInstance //调用NewInstance
…
End; {\Source\RTL\sys\system.pas,第8939行}
VmtNewInstance=-12; 它是NewInstance 函数在类中的偏移量，则“CALL dword ptr [EAX].vmtNewInstance”实际上就是调用NewInstance，请看TObject.NewInstance:源码：
class function NewInstance: TObject; virtual;
class function TObject.NewInstance: TObject;
begin
Result := InitInstance(_GetMem(InstanceSize));
end;
“InitInstance(_GetMem(InstanceSize))”依次调用了三个函数:
1) 首先调用InstanceSize(),返回实际类的对象大小
class function TObject.InstanceSize: Longint; //相当于一个虚方法
begin
Result := PInteger(Integer(Self) vmtInstanceSize)^;//返回实际类的对象大小
end;
2) 调用_GetMem()在堆上分配Instance大小的内存，并返回对象的引用
3) 调用InitInstance()进行构造物理数据结构，并把成员设置默认值，比如把整型的数据成员的值设为0，指针设为nil等。如果有虚方法，把虚拟方法表Vmt的入口地址赋给对象的前四个字节。
在调用完NewInstance之后，这个时候的对象，只有“空壳”，而没有实际的“内容”，所以就需要要调用定制的构造函数对对象进行有意义的初始化，以及调用内部子对象的构造函数，使程序中的对象能真实反映现实世界的对象。这就是对象创建的全过程。
2.3构造函数另类用法(使用类引用实现构造函数的多态性)
在Delphi中，类也是作为对象存储的，所以同样存在着多态性，它是借助类引用和虚类方法来实现的，这样提供了类一级的多态的实现。把类方法设为虚方法，在其派生类中覆载（override）它，再通过基类的引用/指针调用它，这样根据类引用/指针指向实际类来构造对象。请看下面的程序:
TmyClass=class
constructor create;virtual;
end;
Ttmyclass=class of TmyClass;//基类的类引用
TmyClassSub=class(TmyClass)
constructor create; override;
end;

procedure CreateObj(Aclass:TTMyClass;var Ref);
begin
Tobject(Ref):=Aclass.create;
//ref为无类型，和任何类型都不兼容，所以使用时必须显式强制转换(cast)
//Aclass为类引用，统一的函数接口，不同的实现。
//它会根据Aclass引用/指向的实际类来构造对象。
End;
…
CreateObj(TmyClass,Obj);
CreateObj(TmyClassSub,subObj);
3 析构函数与销毁对象
3.1 什么是析构函数(“天生的”虚方法)
从OOP思想的语义上讲，析构函数负责销毁对象，释放资源。在Delphi中，同义。
Delphi为析构函数也定义了一种方法类型(mkConstructor,参见Delphi安装目录下的\Source\RTL\Common\typInfo.pas,125行)，在VCL中，它实际是一种“天生的”虚方法，在VCL类所有的祖先-Tobject中定义了“destructor Destroy; virtual; ”。为什么VCL要这么做呢？因为它要保证在多态情况下对象能正确地被析构。如果不使用虚方法，则可能只析构了基类子对象，从而造成所谓的“内存泄露”。所以为了保证正确地析构对象，析构函数都需要加override声明。
3.2 对象销毁的全过程

先销毁派生类子对象，再销毁基类子对象。
提示
在派生类中，基类子对象指从基类中继承的部分，派生类中子对象是指新增的部分。
3.3 destroy, free, freeAndNil, release用法和区别
destroy:虚方法
释放内存,在Tobject中声明为virtual,通常是在其子类中override 它，且要加上inherited关键字，才能保证派生类对象正确地被销毁;
但destroy一般不能直接用，为什么？
假如当一个对象为nil，我们仍然调用destroy，此时会产生错误。因为destroy是虚方法,它要根据对象中的头四个字节找到虚拟方法表Vmt的入口地址，从而找到destroy的入口地址，所以此时对象一定要存在。但free就是静态方法,它只需根据对象引用/指针的类型来确定，即使对象本身不存在也没问题，而且在free中有判断对象是否存在的操作，所以用free比用destroy安全。
2)free:静态方法
测试对象是否为nil, 非nil则调用destroy。下面是free的Delphi代码:
procedure Tobject.Free;
begin
if Self <> nil then
Destroy;
end;
一静一动，取长补短，岂不妙哉！
不过，调用Destroy只是把对象销毁了，但并没有把对象的引用设为nil，这需要程序员来完成，不过自从Delphi5之后，在sysUtils单元中提供了一个freeAndNil。
3)freeAndNil;一般方法，非对象方法，非类方法。
SysUtils单元中FreeAndNil 定义
procedure FreeAndNil(var Obj);
var
Temp: TObject;
begin
Temp := TObject(Obj);
Pointer(Obj) := nil;
Temp.Free;
end;
建议大家用它代替free/Destroy，以便确保正确地释放对象。
4)release；TcustomForm中定义的静态方法。
当窗口中所有的事件处理完之后，才调用free函数。常用在销毁窗口，而在这个窗口中事件处理需要一定的时间的时候，用这个方法能确保窗口事件处理完之后才销毁窗口。下面是TCustomForm.Release的Delphi源代码:
procedure TCustomForm.Release;
begin
PostMessage(Handle, CM_RELEASE, 0, 0);
//向窗口发CM_RELEASE消息到消息队列，当所有的窗口事件消息处理完之后，
//再调用CM_RELEASE消息处理过程CMRelease
end;
再看看下面CM_RELEASE消息处理过程CMRelease的定义:
procedure CMRelease(var Message: TMessage); message CM_RELEASE;
procedure TCustomForm.CMRelease;
begin
Free; //最后还是free;
end;
4 VCL构造&析构体系结构

TObject
constructor Create;//静态方法
destructor Destroy; virtual;

TPersistent
destructor Destroy; override;

TComponent
constructor Create(AOwner: TComponent); virtual;
destructor Destroy; override;

TControl
constructor Create(AOwner: TComponent); override;
destructor Destroy; override;

…
下面分析VCL中的构造和析构的源代码，以Tcontrol为例：
constructor TControl.Create(AOwner: TComponent);
begin
inherited Create(AOwner);//创建基类子对象,并把析构权移交给AOwner。放在最前面
//这样就保证了“先创建基类子对象，再创建派生类子对象”的顺序
…//初始化，以及调用内部子对象的构造函数
end;

destructor TControl.Destroy;
begin
…//析构派生类中内部子对象
inherited Destroy;//析构基类对象,放在最后面
//这样就保证了“先析构派生类子对象，再析构基类子对象”的顺序
end;
5 正确使用构造函数和析构函数
经过上面的分析，下面总结一下使用构造函数和析构函数的原则：
在使用对象之前，必须先建立一个对象时，并且及时销毁对象，以释放资源。
两个对象引用赋值时，要确保出现的无名对象(指没有被引用的对象)能被释放。
当创建一个组件时，建议设置一个宿主组件(即使用AOwner参数，通常是窗体)，由Aowner来管理对象的销毁，那么就不必惦记着销毁该组件了，这是Delphi在窗体上/数据模块设计并创建组件是采用的方法。所以我们不必书写调用该组件的析构函数。
当函数的返回类型为对象时，那么Result也是对象的引用，确保Result引用的对象要存在。
若要使用obj<>nil 或assigned(nil)测试对象存在时，在调用析构之后还应obj:=nil。

请参考演示程序的源代码
说明（建议要有）
所有的Delphi程序已在win2k Delphi6 sp2 上通过，对于C 程序，只是为了说明与Delphi中不同，并不保证能直接运行。为了加深对本篇文章的理解，建议参考演示程序。
这篇文章包括了我在学习VCL/RTL中的一些经验和体会，加上本人的个人能力有限，难免出现错误，请大家不吝指正！
在阅读本篇文章之前，需要读者对Oriented Pascal语言有一定的了解，并能理解多态，如果您对其中一些概念还不是很清楚的话，请参考相关文章。
通过本篇文章，你应该能比较清楚地理解Delphi中的对象模型、构造&析构实现机制以及VCL中构造&析构体系结构，并能掌握使用构造&析构的使用方法。Delphi中的构造&析构相当于C 中的算是简单多了，我们应该能掌握它。

posted @ 2009-03-04 21:33 谭志宇阅读(614) 评论(0) 编辑收藏举报

刷新页面返回顶部

(转)剖析Delphi中的构造和析构

公告