C++ allocator 自定义指南
闲话
昨天培神在群里抱怨说自定义allocator遇到了奇怪的问题,然后选择了pmr,我表示很理解。allocator这个东西,出生时就伴随着设计错误和无用的抽象,C++03-14糊了这么久,甚至还加了新feature来兼容旧翔和糊新翔,结果C++17最终还是另立门派搞了个pmr。
简单说,虽然allocator的concept说了很多东西,也有一些周边的concept比如allocator aware container和语言设施如allocator_traits的支持,allocator的自定义依然收到了极大的限制。
我对此的结论是,虽然C++11开始标准自称支持stateful allocator,但从各种各样的历史和标准库实现隐含的限定中推导得到,对allocator的自定义只能是stateless的。从实现上讲,allocator里最多只能放一个指针。
容器实现强制要求allocator支持拷贝和转换
allocator作为容器的构造参数,是被拷贝进容器的,而对于一个有状态的allocator,它的拷贝不一定是合理的。其次,容器可能使用rebind获得另一个allocator类型,然后使用传入的allocator来转换构造,这种转换构造实际上也是一种拷贝,而之前说过了,拷贝不一定合理。再次,各大标准库都会在debug版本的容器中保存一些元信息,而这些元信息占用的内存,也是使用allocator分配的,所以往往在debug模式下,容器实现需要两个allocator,一个是allocator<value_type>,另一个是allocator<metadata>,容器会在需要分配元信息的位置用allocator<value_type>当场转换构造出allocator<metadata>并使用(比如MSVC),所以你可能会在容器中看到如下代码
//片段1
void some_container::check_some_metadata() {
#ifdef _DEBUG
allocator<metadata> _metaal(this->_allocator); //当场构造
_metaal.allocate(...); //使用
_metaal.deallocate(...); //使用
#endif
}
对于有状态allocator,拷贝不一定合理,以stack_allocator为例,他可能有两种实现,一种是内部装一个定长数组的
struct stack_allocator {
byte _stack[MAX_SIZE];
byte* _stack_ptr;
};
另一种是内部装有指向外部固定空间的指针的
struct stack_allocator {
byte* _stack_bottom;
byte* _stack_top;
};
第一种实现完全无法拷贝,因为它只能被用户定义在确定的位置上,由用户保证他的生命周期大于等于所分配的内存的生命周期,如果允许了它的拷贝,在片段1的代码中就会出现问题。因为函数返回后空间就不复存在。
第二种实现和第一种一样不可行,首先,浅拷贝是不合理的,如果你使用副本allocator分配了空间,副本的stack_top指针移动到了新的位置,而本体的指针却没有变化,那下一次使用本体来分配空间,也会出现问题。
为此,C++标准特别规定,allocator拷贝(或转换)之后,两个allocator分配的空间必须能互相释放,进一步确认了allocator无法有状态的事实。
即使你放弃了调试便利,使用了宏等条件编译选项禁用了容器内的debug信息,保证了容器只使用一个allocator,依然不能解决问题。这个问题来源于我们提到过的,allocator被拷贝进容器,以及rebind的存在。你可能想通过不提供allocator参数,让容器通过默认构造的方式来构造allocator来避免拷贝,然而这样依然不可能,以MSVC的容器为例,在没有提供allocator时,容器的最外层构造函数会默认构造容器,然后将他拷贝给内部实现,就像如下的伪代码那样
template<class T, class Al>
class vector_base { //内部实现
vector(const Al& a)
: _allocator(a) //拷贝
{}
//...
};
template<class T, class Al = /*...*/>
class vector : vector_base<T, Al> //内部实现
{
vector() :
vector_base(Al())
{}
//...
}
对于map这种value_type和allocator实际分配的东西不一样的情况,实现也会从构造函数接受(或默认构造)一个allocator<value_type>然后将他传给rebind得到的allocator<node>来进行转换构造,也不行。
看起来在这种情况下,有状态allocator只能通过引用计数来共享状态才能实现了,这就是我上面所说的结论,allocator里最多放一个指针了。
讽刺的是,容器的的拷贝构造和拷贝赋值却没有对allocator的拷贝性质提出要求,实现会通过allocator_traits判断allocator是否可以拷贝(propagate_on_container_copy_construction),对于不能拷贝的allocator,移动构造(赋值)不会直接进行内部指针的交换,而是像拷贝构造(赋值)那样,在目标容器预留够空间,然后将元素一个一个move过去。可是这设计有p用,你根本写不出来不能拷贝的allocator。
主从allocator无法解决问题
对于这种不能拷贝的情况,我曾经构想过一种hack,是通过特殊实现allocator的rebind,让allocator::rebind<U>返回一个ref_allocator,通过它来引用主allocator,进而达到不通过引用计数来让rebind后的allocator和主allocator共享状态的目的(如下面代码),这样子看似可以解决片段1中的问题。然而依然有其他的问题没有解决,那就是对于map, set这样的容器,容器内部只会保存rebind后的allocator_ref,而不会存储主allocator,这样你就只能自己手动控制在外面当啷着的allocator的生命周期要随容器一起,这么做并不好。而且,这样的实现还禁用了容器的默认构造,因为默认构造的allocator<value_type>用来构造allocator_ref后就结束了生命周期,此时allocator_ref内部储存的是主allocator的悬挂引用。
//主从allocator设计示意
template<class U, class T>
struct allocator_ref {
allocator<T>* _ref;
template<class U2>
struct rebind {
using other = allocator_ref<U2, T>;
};
};
template<class T>
struct allocator {
template<class U>
struct rebind {
using other = allocator_ref<U, T>;
};
};
fancy pointer也不是那么fancy
allocator::pointer可以是一个自定义的fancy pointer,并且容器的实现也假定了allocator可能使用fancy pointer,比如MSVC的string里面那个union就写了空的构造函数来支持其中的pointer成员是对象的情况。然而fancy pointer依然不能是有状态的,标准要求fancy pointer必须能和它指向的对象的裸指针无痛转换,所以shared_ptr不是fancy_pointer,unique_ptr勉强算。你想通过fancy pointer来封装某些复杂抽象的希望又破灭了。
鸡肋的allocator::construct
construct函数接受变长参数,在给定指针上构造对象,这个函数你以为它有很大的扩展空间?实际上他几乎不能在对象构造上做太多文章,我本想通过它来实现在fancy pointer上自定义构造,可他从C++11开始接受的就是裸指针了,就算你自定义的construct强行不写裸指针作为参数,allocator_traits在转发costruct调用的时候传给你的也是裸指针,没有办法用它来实现fancy pointer上的自定义构造。
其次,allocator<T>的construct不能只用来构造T,这让想打细算地尝试根据T的类型来压缩分配内存的空间的想法变得不可能。为什么不能只用来构造T呢,还是rebind,以MSVC的map为例,rebind得到的allocator<node>分配的是node类型,然后实现会用allocator<node>的construct在node类型的value_type成员上construct那个pair,也就是说会有如allocator<node>.construct<value_type>(value_type*)这样的调用,这还玩毛。
你还能对construct抱什么自定义的希望呢?顶多就用cout打个log了吧,储存几个调试对象都做不到,因为我们前面说过了,allocator不能有状态。
标准库怎么做的?pmr
pmr干了什么?你自己在别处开个memory_resource,然后pmr::allocator里面装个指针去引用它。好了,无状态,支持拷贝和转换,支持自定义分配,实现简单,容器不会因为allocator类型不一样无法拷贝,兼容旧标准代码,兼容scoped_allocator_adapter,简直完美。
就是有个虚函数很不爽。