C/C++内存管理器

C标准库提供了malloc,free,calloc,realloc,C++标准库还提供了new, new[], delete, delete[]。这些用来管理内存,看起来够用了,为啥还要自己写一个内存管理器呢?

原因还是从性能考虑:例如malloc和new是出于通用性考虑的,能处理多线程情况(multithread)。对于单线程的程序,这种额外的功能反而降低性能。
而且还注意到,new/delete/free/malloc都是要在user-space和kernel-code做切换的,context的切换会降低性能。如果自己写一个user-land的内存管理器,就能大幅减少这种切换。还有就是GC(garbage collection)。

几点要求

  1. 速度:比编译器的内存分配器要快才行
  2. 鲁棒:不能有内存泄漏,分配多少就收回多少
  3. 方便:用户不怎么需要改代码,就能把内存管理器加进去
  4. 移植:应当跨平台,用户在啥系统上都能用,方便移植

前人经验

  1. 申请大块内存
    一次性申请一大块内存,减少向系统申请的次数,以后需要申请内存就从这一大块上分配。
    (这不就是缓存么。。)
  2. 为特定尺寸优化
    任何程序中都一种最常见的内存申请尺寸。为这种尺寸优化,提升性能。
  3. 需要删除的内存暂时存放在容器中(敝帚自珍)
    从用户角度看,变量声明周期结束,要释放分配的内存;但是内存管理器实际上可以“不真的把这块内存还给系统”,而是攒起来留给后续需要分配内存时用。当然,这种内存更多的是碎片,所以再分配时可能不够用,那就得再找大块内存去分配了。

代码,版本1

首先是一个不使用内存管理器的代码,内存的申请和释放是手动完成的,并且放在for循环中,来频繁的申请和释放,方法这种做法的效果(慢啊)。代码:

#include <ctime>
#include <iostream>
using namespace std;
 
class Complex
{
public:
	Complex(double a, double b) : r(a),c(b)
	{
	}
private:
	double r;				//实部
	double c;				//虚部
};
 
int main(int argc, char* argv[])
{
	Complex* array[1000];
	clock_t t1,t2;
	t1 = clock();
	for (int i = 0; i < 5000; i++)
	{
		for (int j = 0; j < 1000; j++)
		{
			array[j] = new Complex(i,j);
		}
		for (int j=0;j<1000;j++)
		{
			delete array[j];
		}
	}
	t2 = clock();
	cout << double(t2-t1)/CLOCKS_PER_SEC << "s" << endl;
	return 0;
}

代码,版本2

这次用一个内存管理类来托管内存的申请和释放,并且原有的Complex类上仅仅是重载了new/delete/new[]/delete[]这四个operator。放码过来:

#include <iostream>
#include <sys/types.h>

using namespace std;


class IMemoryManager{
public:
    virtual void* allocate(size_t) = 0;
    virtual void  free(void*) = 0;
};


class MemoryManager: public IMemoryManager{
public:
    MemoryManager(){
        freestorehead = NULL;
        ExpandPoolSize();
    }
    ~MemoryManager(){
        CleanUp();
    }
    void* allocate(size_t);
    void  free(void*);
private:
    struct FreeStore{
        FreeStore* next;
    };
    void ExpandPoolSize();
    void CleanUp();
    FreeStore* freestorehead;
};

MemoryManager gMemoryManager;

class Complex {
public:
    Complex(double a, double b): r(a), c(b){}

    inline void* operator new(size_t size){
        return gMemoryManager.allocate(size);
    }

    inline void operator delete(void* object){
        gMemoryManager.free(object);
    }

    inline void* operator new[](size_t size){
        return gMemoryManager.allocate(size);
    }

    inline void operator delete[](void* object){
        return gMemoryManager.free(object);
    }
private:
    double r;
    double c;
};


void* MemoryManager::allocate(size_t size){
    if (0==freestorehead){
        ExpandPoolSize();
    }
    FreeStore* head = freestorehead;
    freestorehead = head->next;
    return head;
}

void MemoryManager::free(void* object){
    FreeStore* head = static_cast<FreeStore*>(object);
    head->next = freestorehead;
    freestorehead = head;
}

const int POOLSIZE = 128;

void MemoryManager::ExpandPoolSize(){
    size_t size = max(sizeof(Complex), sizeof(FreeStore*));
    FreeStore* head = reinterpret_cast<FreeStore*>(new char[size]);
    freestorehead = head;

    for(int i=0; i<POOLSIZE; i++){
        head->next = reinterpret_cast<FreeStore*>(new char[size]);
        head = head->next;
    }
    head->next = 0;
}

void MemoryManager::CleanUp(){
    FreeStore* nextPtr = freestorehead;
    for(; nextPtr; nextPtr=freestorehead){
        nextPtr = freestorehead;
        freestorehead = freestorehead->next;
        delete[] nextPtr;
    }
}


int main(int argc, char* argv[])
{
    Complex* array[1000];
    clock_t t1,t2;
    t1 = clock();
    for (int i = 0; i < 5000; i++)
    {   
        for (int j = 0; j < 1000; j++)
        {   
            array[j] = new Complex(i,j);
        }   
        for (int j=0;j<1000;j++)
        {   
            delete array[j];
        }   
    }   
    t2 = clock();
    cout << double(t2-t1)/CLOCKS_PER_SEC << "s" << endl;
    return 0;
}

分析

时间开销对比

g++ main_v1.cpp -o main_v1 -O3
./main_v1
0.217214s

g++ main_v2.cpp -o main_v2 -O3
./main_v2
0.026611s

两者的时间开销竟然相差一个数量级。

代码的正确性
其实new()申请内存的代码很不严谨,没有检查形参size是否会超过预设POOLSIZE大小,只不过通常情况下单次的size肯定小于POOLSIZE,但是极端情况下,或者一口气申请了多个变量的内存,可能会越界。另外,只适用于单线程。

以上内容来自IBM的一篇教程,还有很多内容没能看完和理解,挖坑带填:https://www.ibm.com/developerworks/aix/tutorials/au-memorymanager/index.html

posted @ 2018-08-21 23:49  ChrisZZ  阅读(552)  评论(0编辑  收藏  举报