空间配置器
空间适配器,所谓空间适配器,就是用来管理内存的一个器具。对于STL来说,空间适配器是它可以正常工作的基础,也为它可以高效工作提供了动力。对于使用STL来说,它是不和用户直接打交道的,而是隐藏在一切STL组件之后,默默为各种内存申请提供支持的。
对于c++用户来说,new和delete很熟悉,这两个函数可以分别完成内存的申请和释放,和c里面的malloc和free如出一辙,SGI 有一个标准空间适配器,同时还有一个特殊空间适配器,标准空间适配器为:std::allocator,这个适配器只是对new和delete的浅层包装,所以没有什么技术含量,所以在SGI中从没使用过这个标准适配器。另一个空间适配器是std:alloc,这是一个具有次分配能力的特殊空间适配器,它具有一级和二级适配器,它们协调工作。
Std::alloc的主要思想是:定义一个空间大小阈值,128bytes,如果申请的空间大于128bytes,那么就调用第一级空间适配器来完成分配工作,如果小于128bytes,那么就调用第二级空间适配器来完成。对于第一级适配器,直接调用malloc和free来完成分配与释放内存的工作(没有调用new和delete),最为重要的是,第一级适配器具有new-handle机制,用户可以指定当出现out-of-memory时的处理函数,在SGI里面,当第一级alloc失败时,会接着调用oom_alloc函数来尝试分配内存,如果oom发现没有指定new-handler函数的话,那就无能为力了!会抛出__THROW_BAD_ALLOC这个异常,下面是第一级适配器的主要流程(对于alloc来讲,其他如realloc一样):
1、空间分配器的“分线器”
static void * allocate(size_t n)
{
void *result = malloc(n);//直接使用第一级分配器,直接使用malloc
if (0 == result)
result = oom_malloc(n);//第一级分配器失效了,那就使 用第二级分配器,oom(out of memeory)
return result;//将分配的空间以void*的方式返回,用户可以随意转化为需要的类型
}
n为我们想要申请的内存,如果malloc可以满足要求的话,直接返回,否则交由oom_malloc()来处理。
2、具有new-handler的oom_malloc
template void * __malloc_alloc_template::oom_malloc(size_t n) {
void (* my_malloc_handler)();
void *result;
for (;;)
{
//这个循环将不断尝试释放、配置、再释放、再配置
my_malloc_handler = __malloc_alloc_oom_handler; if (0 == my_malloc_handler)
{
__THROW_BAD_ALLOC;
}
(*my_malloc_handler)();//这个函数将试图释放内存
result = malloc(n);
//分配内存
if (result)
return(result);
//如果内存已经得到满足的话,那么就可以返回了,如果不满足,那么 //就继续释放,分配....
}
} 其中的__malloc_alloc_oom_handler就是由用户设定的new-handler,我们可以通过下面的函数来设定
这个句柄: static void (* set_malloc_handler(void (*f)()))()
{
void (* old)() = __malloc_alloc_oom_handler;//old handler of outing of memory
__malloc_alloc_oom_handler = f;//new handler for hander the out of memory
return(old);
}
是不是看起来oom_malloc也没做什么事情,就是一直在循环申请内存?在一个循环里oom_handler->malloc….就等着某一个时刻成功申请到内存了,就可以返回交差了!!
我们重点来看看第二级配置器,这才是SGI的经典(个人),我们需要再次知道第二级分配器是怎么“被”工作的,当用户申请的内存大小小于128bytes时,SGI配置器“分线器”就会将这个工作交由第二级分配器来完成。此时,第二级分配器就要开始工作了。第二级分配器的原理较为简单,就是向内存池中申请一大块内存空间,然后按照大小分为16组,(8,16…..128),每一个大小都对应于一个free_list链表,这个链表上面的节点就是可以使用的内存空间,需要注意的是,配置器只能分配8的倍数的内存,如果用户申请的内存大小不足8的倍数,配置器将自作主张的为用户上调到8的倍数,所以有时候你明明超出边界了但是系统却没有阻止你的行为的时候,你应该知道是SGI空间配置器救了你。
当然,第二级配置器的原理远没有这么简单,上面我们说到第二级配置器如何管理内存,现在,我们要开始为用户分配内存和回收内存了。
当用户申请一个内存后,第二级配置器首先将这个空间大小上调到8的倍数,然后找到对应的free_list链表,如果链表尚有空闲节点,那么就直接取下一个节点分配给用户,如果对应链表为空,那么就需要重新申请这个链表的节点,默认为20个此大小的节点。如果内存池已经不足以支付20个此大小的节点,但是足以支付一个或者更多的该节点大小的内存时,返回可完成的节点个数。如果已经没有办法满足该大小的一个节点时,就需要重新申请内存池了!所申请的内存池大小为:2*total_bytes+ROUND_UP(heap_size>>4),total_bytes是所申请的内存大小,SGI将申请2倍还要多的内存。为了避免内存碎片问题,需要将原来内存池中剩余的内存分配给free_list链表。如果内存池申请内存失败了,也就是heap_size不足以支付要求时,SGI的次级配置器将使用最后的绝招–>查看free_list数组,查看是否有足够大的没有被使用的内存,如果这些办法都没有办法满足要求时,只能调用第一级配置器了,我们需要注意,第一级配置器虽然是用malloc来分配内存,但是有new-handler机制(out-of-memory),如果无法成功,只能抛出bad_alloc异常而结束分配。
上面说到的配置器“分线器”,其实就是次级配置器的入口,如果次级配置器发现所需要分配的内存大于128bytes时,就会交由第一级配置器去完成,否则由自己完成。
下面,我们就来看看这个次级配置器是怎么实现的:
enum {__ALIGN = 8};//小型区域的上调边界,用户如果申请30bytes大小内存,系统将返回32bytes给用户
enum {__MAX_BYTES = 128};//小型区域的上限,超过这个大小将直接由第一级配置器直接配置内存
enum {__NFREELISTS = __MAX_BYTES/__ALIGN};//free-list链表的个数,从8一直到128,总共需要16个链表维护每个级别大小的链表
我相信不需要说什么就可以明白,上面的代码是在定义最小和最大的空间大小,和需要的链表的个数,为什么要定义这个呢?
也就是说,如果你觉得SGI STL的配置器过于频繁的调用次级配置器,那么你可以修改进入次级配置器的条件,比如可以修改成16-128,或者32-256等等。我们需要明白的事情是,虽然次级配置器解决了内存碎片的问题,但是给内存管理带来了额外的负担,有可能需要不断去调整free_list,甚至去反过来调用第一级配置器,所以如果你觉得进入配置器的区间不够合理的话,可以自己调整!
static size_t ROUND_UP(size_t bytes) { return (((bytes) + __ALIGN-1) & ~(__ALIGN - 1));
} 上面这个函数返回离bytes最近的可以被8整除的整数,取上。 下面我们看看free_list的节点的数据结构: union obj
{
union obj * free_list_link;
char client_data[1]; /* The client sees this. */
};
如此巧妙地运用union来管理节点,如果还没有被分配,那么free_list_link有效,如果已经分配给用户,那么client_data[1]有效。不会造成多余的浪费!
下面这个定义就是我们所说的free_list链表数组,每一个数组元素都将对应一个链表:
static obj * __VOLATILE free_list[];
下面这个函数将找到所申请的内存所对应的空闲链表,注意,SGI将用户的内存申请大小上调至8的倍数:
static size_t FREELIST_INDEX(size_t bytes)
{
return (((bytes) + __ALIGN-1)/__ALIGN - 1);
}
次级配置器将会使用内存池,所以下面给出内存池的区间。
static char *start_free; //内存池的开始位置 static char *end_free;//内存池的结束位置
下面就是激动人心的内存分配函数了,该函数将首先判断区间大小,如果大于128bytes,就调用第一级配置器,小于128bytes就寻找对应的free_list链表,如果有可用的,直接拿,如果没有,则调用函数refill来重新分配节点(20个)。
/* n must be > 0 */
static void * allocate(size_t n)
{
obj * __VOLATILE * my_free_list;
obj * __RESTRICT result; //如果空间大于128bytes,直接调用第一级空间配置器
if (n > (size_t) __MAX_BYTES)
{
return(malloc_alloc::allocate(n));
}
//找到相应的free_list的链表
my_free_list = free_list + FREELIST_INDEX(n);
# ifndef _NOTHREADS
/*REFERENCED*/
lock lock_instance;
# endif
result = *my_free_list;
//如果该链表已经没有可以使用的节点了,那么就重新分配节点
if (result == 0)
{
//refill函数用来为该链表重新分配节点(20个)
void *r = refill(ROUND_UP(n));
return r;
}
//修改free_list链表,拿掉一个
*my_free_list = result -> free_list_link;
return (result);
}; 有申请就需要回收内存,下面就是次级配置器的空间释放函数,该函数将判断区间大小,
大于128bytes直接调用第一级配置器来回收内存,小于128bytes则回收到相应的
free_list链表中,较为简单。 /* p may not be 0 */
static void deallocate(void *p, size_t n)
{
obj *q = (obj *)p;
obj * __VOLATILE * my_free_list; //大于128bytes,交由第一级配置器完成回收
if (n > (size_t) __MAX_BYTES)
{
malloc_alloc::deallocate(p, n);
return;
}
//找到对应的链表
my_free_list = free_list + FREELIST_INDEX(n); // acquire lock
# ifndef _NOTHREADS
/*REFERENCED*/
lock lock_instance;
# endif /* _NOTHREADS */
//将这个节点加到这个链表里面去
q -> free_list_link = *my_free_list;
*my_free_list = q; // lock is released here
} 下面我们来看看refill函数,这个函数完成重新给链表分配节点的工作。新的空间
将从内存池中取到,(内存池由chunk_alloc管理),缺省的话只取20个新节点,
但有可能小于20个节点。 template
void* __default_alloc_template::refill(size_t n)
{
int nobjs = 20; //缺省取20个新节点
//向内存池申请20个该链表节点
char * chunk = chunk_alloc(n, nobjs);
obj * __VOLATILE * my_free_list;
obj * result;
obj * current_obj, * next_obj;
int i;
//很不幸但是又很幸运,我们取得了1个节点,那就直接返回吧,不需要更新链表了
if (1 == nobjs) return(chunk); //否则要开始准备调整free_list链表了,这也是次级配置器内存管理开销的地方 //my_free_list将指向我们的目标链表头
my_free_list = free_list + FREELIST_INDEX(n);
/* Build free list in chunk */
result = (obj *)chunk;//这一块是准备返回给用户的!
//将free_list指向新配置的空间里面去
*my_free_list = next_obj = (obj *)(chunk + n);
//第一块已经返回给用户,从第二块开始把这块空间串起来
for (i = 1; ; i++)
{
current_obj = next_obj;
next_obj = (obj *)((char *)next_obj + n);
//已经连接完成了
if (nobjs - 1 == i)
{
current_obj -> free_list_link = 0;
break;
}
else
{
//否则还没有连接完成
current_obj -> free_list_link = next_obj;
}
}
return(result);
}
下面就是最为重要的也是最难的内存池了。当然,下面这个函数只是从内存池中取出空间给free_list用而已。
不过整个过程很曲折,很经典,需要仔细品味,很棒的设计! char* __default_alloc_template::chunk_alloc(size_t size, int& nobjs)
{
char * result;
size_t total_bytes = size * nobjs;
//这个是内存池中剩余的空间,这是一块连续的空间
size_t bytes_left = end_free - start_free;
//如果内存池中的空间足以支付申请,那么只是改变内存池的剩余大小就ok啦
if (bytes_left >= total_bytes)
{
result = start_free;
start_free += total_bytes;
return(result);
}
//否则,看看是不是足以支付至少一个节点的空间,如果可以,那么也不要灰心
else if (bytes_left >= size)
{
//计算出可以支付的节点个数
nobjs = bytes_left/size;
//调整内存池大小
total_bytes = size * nobjs;
result = start_free;
start_free += total_bytes;
return(result);
}
//这是最惨的,内存池已经没有足够的内存来支付申请了,只好向heap申请空间了
//申请的空间大小是所要求的2倍还要多一点
else
{
size_t bytes_to_get = 2 * total_bytes + ROUND_UP(heap_size >> 4);
// Try to make use of the left-over piece.
//将原来内存池中剩下的空间分配给相应的链表,避免内存碎片
if (bytes_left > 0)
{
obj * __VOLATILE * my_free_list = free_list + FREELIST_INDEX(bytes_left);
((obj *)start_free) -> free_list_link = *my_free_list;
*my_free_list = (obj *)start_free;
}
//重新之指定内存池区间,就是要malloc!!!
start_free = (char *)malloc(bytes_to_get);
//如果malloc失败
if (0 == start_free)
{
int i;
obj * __VOLATILE * my_free_list, *p;
//上面说的很明白,去free_list链表里面找
//将没有被使用的内存释放了!!!
for (i = size; i <= __MAX_BYTES; i += __ALIGN)
{
my_free_list = free_list + FREELIST_INDEX(i);
p = *my_free_list;
if (0 != p)
{
*my_free_list = p -> free_list_link;
start_free = (char *)p;
end_free = start_free + i;
//每次释放一个free_list节点,就再次调用自己尝试能否成功! //这是贪心吗?可能不是,是愚蠢!!!
return(chunk_alloc(size, nobjs));
// Any leftover piece will eventually make it to the
// right free list.
}
}
//哎,已经没有办法了,向第一级配置器求助吧,好歹那里有out-of-memory机制
//可以处理malloc失败的问题,当然前提是需要有合适的new-handler
end_free = 0; // In case of exception.
start_free = (char *)malloc_alloc::allocate(bytes_to_get);
// This should either throw an // exception or remedy the situation. Thus we assume it // succeeded.
}
//能运行到这里说明已经求助过第一级配置器了,能做的就是调整内存池的大小
//然后再次调用自己来完成原来无法完成的工作!!
heap_size += bytes_to_get;
end_free = start_free + bytes_to_get;
return(chunk_alloc(size, nobjs));
}
}
讲完了上面的内容,我们现在应该很清楚次级配置器是怎么工作的了,其实,我们可以看到第一级配置器就是为了配合第二级配置器而存在的,重点在于次级配置器的设计原理。