C++ : 如何用C语言实现C++的虚函数机制？

前言

在 googletest的源码中，看到gtest-matchers.h 中实现的MatcherBase 类自定义了一个 VTable，这种设计实现了一种类似于C++虚函数的机制。C++中的虚函数机制实质上就是通过这种方式实现的，本文用c语言自定义虚函数表VTable实现了一下virtual的功能，来深刻理解其机制。我们通过创建存储函数指针的结构体来模拟这种行为。

C++的运行时多态

如果我们在C++中有一个抽象基类 Shape ，定义了纯虚函数GetArea() 用于计算面积。对于不同的派生于 Shape 的类，面积计算方法会不一样。比如，对于圆形 Circle类，是 Shape 的一种，其特有属性为半径r，面积计算公式为 π·r² ；对于正方形 Square类，其特有属性为边长d，其面积计算公式为 d² 。

基类Shape 的定义如下：

class Shape { 
public:
	virtual double GetArea()=0;
};

派生类Circle 继承于 Shape，定义如下：

class Circle: public Shape  {
public:
  Circle(double r)：radius(r){}
	double GetArea() override {
		return radius * radius * 3.14;
	}
private:
	double radius;
};

通过基类指针指向不同派生类对象，去调用同一个方法，可以实现多态，如下所示：

Shape* shape = new CirCle(5);
shape->GetArea();

那么 virtual 实现多态的底层原理是什么呢？

用C语言简单实现virtual的底层原理

用C语言模拟实现以上C++代码。首先定义一个存储函数指针的结构体VTable，作为 Shape类的虚函数表，其中定义了两个函数指针，分别指向该类计算面积的函数和析构函数，只要目标函数的参数列表和返回类型与函数指针定义相同，其中void*相当于this指针：

struct VTable{
    double (*GetArea)(void*);
    void (*Destructor)(void*);
};

然后定义一个基类Shape的结构体，其中包含了一个指向虚函数表VTable 的指针：

struct Shape{
    VTable* vtable;
};

在派生类 Circle 中，添加了额外的字段 radius，并且包含一个基类的实例，通过这种方式实现继承：

struct Circle{
    Shape base;
    double radius;
};

然后定义一个函数GetArea，作为公共调用接口，该函数接收一个Shape指针作为参数，并通过其指向类的虚函数表调用它的面积计算方法：

double GetArea(Shape* shape){
    return shape->vtable->GetArea(shape);
}

对于Circle类中的面积计算方法，实现如下：

double GetCircleArea(void* obj){
    Circle* circle = (Circle*)obj;
    return 3.14 * circle->radius * circle->radius;
}

最后，在程序中初始化Circle类的虚函数表 circle_vtable ，设置GetArea函数和析构函数，分配一块Circle对象大小的内存，将它的vtable绑定到circle_vtable ，初始化radius的值，并通过Shape类型的指针指向Circle对象，调用虚表中的方法：


VTable circle_vtable = {&GetCircleArea,
                        &CircleDestructor};

Circle* circle = (Circle*)malloc(sizeof(Circle));
circle->base.vtable = &circle_vtable;
circle->radius = 5;

Shape* shape = (Shape*)circle;
printf("Area of circle: %f\n", GetArea(shape));
ShapeDestructor(shape);

输出为：

Area of circle: 78.500000

对于Square 类，也是类似的实现。类设计如下图所示：

完整测试程序地址：https://compiler-explorer.com/z/zbGh7dsh4

自定义VTable的好处

通过virtual实现多态绝大多数时候都够了，那为什么googletest库中要自定义VTable呢？以下是一些好处，供参考，学习一下库开发者的思考角度。

更好的性能

C++的虚函数机制虽然方便，但是它在某些情况下会带来性能开销。例如，虚函数表的查找需要额外的时间，并且每个对象都需要一个指向虚表的指针，这会增加内存的开销。通过自定义的VTable机制，googletest 可以更好地控制这些开销，可能减少间接调用的开销，提高性能。

灵活的内存管理

使用自定义的VTable可以更灵活地管理内存。例如，可以将VTable实例放置在特定的内存区域或共享多个对象之间，从而减少内存占用。这种方式也可以使得一些轻量级对象不需要包含虚表指针，从而减小对象的大小。

跨编译器兼容性

不同的编译器和编译器版本对虚函数的实现可能略有不同，这会导致跨编译器的兼容性问题。通过自定义的VTable机制，googletest 可以避免依赖编译器的实现细节，保证在不同编译器和平台上的一致行为。

类型擦除和多态性

自定义的VTable机制可以实现类型擦除和更灵活的多态性。它允许将不同类型的对象统一处理，而不需要它们共享一个公共的基类。这对于模板编程和泛型编程非常有用，因为可以实现基于模板的多态而不需要依赖继承。

更好的调试和测试

自定义的VTable可以在调试和测试中提供更多的信息。例如，可以在VTable中包含额外的调试信息或断言，以帮助发现和诊断问题。这种灵活性在某些情况下是C++内置的虚函数机制所无法提供的。

总结

这个例子的实现对很多问题还没有考虑到，不过我认为它已经通过C语言基本展示了C++虚函数的原理。理解以上过程后，再去重新思考以下问题，可能会更清晰。

C++ virtual运行时多态的实现原理？
派生类重写虚函数生效的条件是什么？
一个仅有虚析构函数的类大小为多少？
纯虚函数=0是什么含义？
虚函数为什么会稍慢些？其开销有哪些？
为什么构造函数不能是虚函数，而析构函数通常需要是虚函数？

参考

如果你觉得本文对你有帮助，请点个赞，鼓励我持续创作；关注我，一起持续进步！

公众号：七昂的技术之旅

想深入学习C++的同学，可通过以下链接免费获取C++系列书籍。

百度链接 | 谷歌链接

posted on 2024-06-30 21:27 七昂的技术之旅阅读(78) 评论(0) 编辑收藏举报

刷新页面返回顶部