(linux)idr(integer ID management)机制
最近研究进程间通信,遇到了idr相关的函数,为了扫清障碍,先研究了linux的idr机制。
IDR(integer ID management)的要完成的任务是给要管理的对象分配一个唯一的ID,于是可以通过这个数字找到要管理的对象。
应用IDR机制时要包含头文件<linux/idr.h>。
struct idr {
struct idr_layer *top; //idr的top层,可以方便的理解为根节点。
struct idr_layer *id_free; //id_free为首的形成一个链表,这个是预备队,
//并没有参与到top为根的节点中去
int layers; //当前的层数。
int id_free_cnt;// 预备队的个数。
spinlock_t lock;
};
struct idr_layer {
unsigned long
bitmap; /* A zero bit means "space here" */
struct idr_layer
*ary[1<<IDR_BITS];
int count; /* When zero, we can release it */
};
IDR_BITS 在32位操作系统是5 ,64位操作系统是6,我们以32位操作系统为例。
本文的介绍以两层的为例。layers = 2.
idr中的top指向的是当前正在工作的最高层的idr_layer,即图中的A,top的ary是个指针数组,指向
低一层的idr_layer。top层ary指针数组不一定都指向已经分配了的低一层idr_layer。也可能某个指针指
向NULL。如下图的ary[1]就指向NULL。
最后一层idr_layer 叶子层 例如B,他的指针数组ary中的元素,如果分配出去了那么指向某个结构体的地址,这个地址指向要管理的数据结构。如果没有分配出去,指针指向NULL。对于叶子层而言,判断指针数组某个元素是否指向有意义的数据结构,用位图bitmap。bitmap对应的位 是1,表示ary数组的对应元素指向某有意义的数据结构。
最后一层的bitmap的含义已经介绍,但是top层(或者层数大于2的时候,中间某层)bitmap的含义是什么呢?以两层为例,如果图中B的bitmap是0xFFFFFFFF,即每一个指针都分配出去了,那么A的bitmap的第0位置1.同样如果A的bitmap的第2位是1,表示ary[2]指向的C的bitmap是0xFFFFFFFF,即C也ary数组也分配完毕。
这部分是函数idr_mark_full来实现:
static void idr_mark_full(struct idr_layer **pa, int id)
{
struct idr_layer *p = pa[0];
int l = 0;
__set_bit(id & IDR_MASK, &p->bitmap);// 叶子层数字id对应的位 置1.
/*
* If this layer is full mark the bit in the layer above to
* show that this part of the radix tree is full. This may
* complete the layer above and require walking up the radix
* tree.
*/
while (p->bitmap == IDR_FULL) {
if (!(p = pa[++l])) // pa[++l]记录的上一层idr_layer。
break;
id = id >> IDR_BITS;
__set_bit((id & IDR_MASK), &p->bitmap); //如果由于本层满了,则上一层对应位置1.
} //循环检测。
}
介绍完负责工作的部分,下面介绍预备役。所谓预备役就是id_free指向的空闲的idr_layer。所谓空闲是指,这些idr_layer并没有投入。如果需要分配一个idr_layer,首先将id_free指向的idr_layer取出来使用,同时id_free指向下一个。即如下图所示,如果需要分配,D被取出来使用,同时id_free指针指向E,同时id_freecnt减一。
将预备役投入使用是函数alloc_layer完成的:
static struct idr_layer *alloc_layer(struct idr *idp)
{
struct idr_layer *p;
unsigned long flags;
spin_lock_irqsave(&idp->lock, flags);
if ((p = idp->id_free)) {
idp->id_free = p->ary[0]; // id_free 指向D的下一位 E
idp->id_free_cnt--; // 预备役的个数减1
p->ary[0] = NULL; //D要被使用了,第0个指针不再指向E,初始化为NULL
}
spin_unlock_irqrestore(&idp->lock, flags);
return(p); // 返回D
}
有个问题是预备役是怎么来的?如果预备役分配光了怎么办。分配光了也没有关系,还好我们有idr_pre_get函数。
#if BITS_PER_LONG == 32
#define IDR_BITS 5
#define MAX_ID_SHIFT (sizeof(int)*8 - 1) //31
#define MAX_LEVEL (MAX_ID_SHIFT + IDR_BITS - 1) / IDR_BITS //7
#define IDR_FREE_MAX MAX_LEVEL + MAX_LEVEL //14
坦白说,MAX_LEVEL的含义是什么,我并不清楚。为什么一次分配14个idr_layer充当预备役我并不清楚。请清楚的兄弟不吝赐教。
这个函数的含义就是我要分配14个idr_layer,充当预备役。如果中间分配失败,那么能分配几个算几个。投入预备役的函数是free_layer。比较好懂我就不解释了。
int idr_pre_get(struct idr *idp, gfp_t gfp_mask)
{
while (idp->id_free_cnt < IDR_FREE_MAX) {
struct idr_layer *new;
new = kmem_cache_alloc(idr_layer_cache, gfp_mask);
if (new == NULL)
return (0);
free_layer(idp, new);
}
return 1;
}
static void free_layer(struct idr *idp, struct idr_layer *p)
{
unsigned long flags;
/*
* Depends on the return element being zeroed.
*/
spin_lock_irqsave(&idp->lock, flags);
__free_layer(idp, p);
spin_unlock_irqrestore(&idp->lock, flags);
}
static void __free_layer(struct idr *idp, struct idr_layer *p)
{
p->ary[0] = idp->id_free;
idp->id_free = p;
idp->id_free_cnt++;
}
从预备役机制上看,我们可以得到使用idr编程流程应该是这样的。
首先调用idr_pre_get,来分配可用的idr_layer,投入预备役,接下来调用idr_get_new,
给要管理的对象target分配一个数字id,这个过程中可能会调用alloc_layer,将预备役中的
idr_layer投入使用,用在top为根管理结构中。
终有一天,预备役也被打光了idr_get_new
函数返回-EAGAIN,告诉我们,预备役全部阵亡,于是,我们从-EAGAIN的遗言中,知道,我们需要调用
idr_pre_get来充实预备役了。
again: if (idr_pre_get(&my_idr, GFP_KERNEL) == 0) {
/* No memory, give up entirely */
}
spin_lock(&my_lock);
result = idr_get_new(&my_idr, &target, &id);
if (result == -EAGAIN) {
sigh();
spin_unlock(&my_lock);
goto again;
}
下面:讲述如何给要管理的对象分配一个小数字作为id。
首先看知道obj的ID,如果查找obj ,即指向obj的指针。也就是说先看我们想要达到的效果,在来分析如何实现给对象分配ID。
根据ID ,来查找obj。函数idr_find实现查找功能
假如下图中C 的ary[2]指向一个管理的obj。我们来看下如何通过数字66来查找到obj。
我们以top为根的树其实是一个32叉树。如果只有一层,那么top本身指向叶子层,那么最多理32个obj,即ary数组的每个元素,指向一个obj。 但是假如说我们管理的对象超过了32个,我们就不能用一层来管理这个需要有两层结构。就像我们的示意图。
其实idr有一种比较简单的理解方式,就是它是一种32进制的数,满32,向前进一位。
我们还是从示意图讲起。我们寻找66指向的obj。首先判断66是否超过了当前层数所能管理最多obj。
当前我们是两层结构,top指向32叉树的根,top下面管理32个叶子层的idr_layer。上面一讲提到了,叶子层idr_layer的ary数组元素是用来指向目标obj的。那么两层总共可以管理3232=1024个obj。同样道理三层可以最多管理3232*32=32K 个obj。
要想找到obj的指针,必须根据ID,一路寻找的叶子层。66/32 = 2,所以从top--->top->ary[2],
我们就找到了叶子节点C。66|IDR_MASK = 2,所以C的ary[2]指向管理的obj。
用前面的32进制方法理解就是66 = 232+2,所以,top->ary[2]->ary[2]指向obj。
同样我们可以求ID是27对应的obj 27=032+27,所以top->ary[0]->ary[27]指向obj。
小结:通过上面的描述,我们也看到了,我们就是要建立一个32叉树,来管理obj。通过ID,可以一层层定位到叶子层,叶子层的指针指向的就是我们要管理的obj。 需要指出的是32叉树,不一定每个分支都分配好了idr_layer,用到了再分配,防止浪费,比如示意图中,并没有用到32~63,我们看到top->ary[1]为NULL。如有需要分配34了,那没办法,会在分配过程中分配个idr_layer,top->ary[1]指向分配的idr_layer。
void *idr_find(struct idr *idp, int id)
{
int n;
struct idr_layer *p;
n = idp->layers * IDR_BITS;
p = idp->top;
/* Mask off upper bits we don't use for the search. */
id &= MAX_ID_MASK;
if (id >= (1 << n))
return NULL;
while (n > 0 && p) {
n -= IDR_BITS;
p = p->ary[(id >> n) & IDR_MASK];
}
return((void *)p);
}
下面分析如果给一个obj分配个ID。
提供两个函数给obj分配ID
int idr_get_new(struct idr *idp, void *ptr, int *id)
int idr_get_new_above(struct idr *idp, void *ptr, int starting_id, int *id)
参数说明:
idp---不说了,管理结构idr的指针,对应示意图中最左面的那个结构。
ptr---指向要管理的结构的指针,我们的任务就是给它分配个小数字,作为他的身份证。成功之后,我们可以拿着这个ID,直接找到ptr。
id----输出参数,将分配的数字存入id。
这两个函数其中idr_get_new比较乖,比较好说话,随便给他分配一个没人用的id就可以,他他不挑不捡。第二个函数idr_get_new_above有点难说话,要求挺多,他有个参数starting_id,要求分配不小于starting_id的一个数字作为id。
两个函数都是调用了idr_get_new_above_int,区别是idr_get_new将starting_id填成了0.表示随便给分配个大于0的没被别人用的id就行。
-EAGAIN的意思上面一讲提到过,这个是预备役全体阵亡的遗言,没有空闲的idr_layer用来分配了,所以失败了,如果用户非常需要给ptr分配个id,那么请先分配点预备役,即调用idr_pre_get。
-ENOSPC的含义是你小子要的id太大了,超过了MAX_ID_BIT,即2^31,idr说,我是管理小数字的结构,拜托不要那这么大的数字骚扰我。
if ((id >= MAX_ID_BIT) || (id < 0))
return -3; // sub_alloc函数中的语句
int idr_get_new(struct idr *idp, void *ptr, int *id)
{
int rv;
rv = idr_get_new_above_int(idp, ptr, 0);
/*
* This is a cheap hack until the IDR code can be fixed to
* return proper error values.
*/
if (rv < 0) {
if (rv == -1)
return -EAGAIN;
else /* Will be -3 */
return -ENOSPC;
}
*id = rv;
return 0;
}
酝酿了半天,可以聊聊idr_get_new_above_int这个了。
idr_get_empty_slot函数是分配个大于starting_id的数字作为ptr的ID。如果分配成功,id>=0,将叶子节点id对应的ary数组的元素赋值为 ptr。同时将叶子层的count++,表示又分配出去一个。将叶子层的位图bitmap对应槽位置1的工作是idr_mark_full完成。如果叶子层全满了,则通知叶子层的父亲对应槽位置1,依次传递。
static int idr_get_new_above_int(struct idr *idp, void *ptr, int starting_id)
{
struct idr_layer *pa[MAX_LEVEL];
int id;
id = idr_get_empty_slot(idp, starting_id, pa);
if (id >= 0) {
/*
* Successfully found an empty slot. Install the user
* pointer and mark the slot full.
*/
pa[0]->ary[id & IDR_MASK] = (struct idr_layer *)ptr;
pa[0]->count++;
idr_mark_full(pa, id);
}
return id;
}
OK,到了idr_get_empty_slot。这个函数是干重活的函数。需要仔细研读代码。这个函数不举例子很难描述清楚,举例子又显得特别琐碎,很头疼。建议读者从0开始分配一直分配到32需要分层,就可以理解代码的含义。
先讲初始化:
#define IDR_INIT(name) \
{ \
.top = NULL, \
.id_free = NULL, \
.layers = 0, \
.id_free_cnt = 0, \
.lock = __SPIN_LOCK_UNLOCKED(name.lock), \
}
top等于NULL 表示我的32叉树还没建立起来,id_free =NULL,id_free_cnt=0表示不好意思,我的预备役也为空,没法为您分配idr_layer。这是最初的状态,32叉树连个根都没有,整个idr处于一穷二白的状态。
p = idp->top;
layers = idp->layers;
if (unlikely(!p)) {
if (!(p = alloc_layer(idp)))
return -1;
layers = 1;
}
idr_get_empty_slot这个部分,表示如果idr的32叉树连个根都没有,我需要分配一个idr_layer来当根。如果alloc_layer失败,表示预备役空了,惨了,只能返回失败,告诉调用者,预备役没了,请填充预备役。一般是可以分配的。
这个循环体的含义是,用户这个搞得这个starting_id太大了,或者低的id分配出去了,只能给用户分配个大的id。如果这个id大于了当前层数所能管理的最高ID,我们需要加一层了。
以上面的示意图为例,我们当前有两层结构,最多能管理32*32=1K个,我们能分配的最大id就是1023,如果用户要求我们分配大于等于1500的id,那么我们目前的两层结构是无法满足需要的,所以我们需要加一层。首先将layer++,表示我们的32叉树升级了,多了一层,从预备役分配出一个idr_layer,让新分配的new当根。p指针指向根。
如果分配的id不够大,不需要分层,那么这个while就不执行了,直接跳到sub_alloc函数。
while ((layers < (MAX_LEVEL - 1)) && (id >= (1 << (layers*IDR_BITS)))) {
layers++;
if (!p->count)//这个地方是应对特殊情况,比如0~31都没有分配,第一层还没有,用户
//上来要分配32或46这样明显是两层才能完成的结构
continue;
if (!(new = alloc_layer(idp))) {
/*
* The allocation failed. If we built part of
* the structure tear it down.
*/
spin_lock_irqsave(&idp->lock, flags);
for (new = p; p && p != idp->top; new = p) {
p = p->ary[0];
new->ary[0] = NULL;
new->bitmap = new->count = 0;
__free_layer(idp, new);
}
spin_unlock_irqrestore(&idp->lock, flags);
return -1;
}
new->ary[0] = p;
new->count = 1;
if (p->bitmap == IDR_FULL)
__set_bit(0, &new->bitmap);
p = new;
}
idp->top = p;
idp->layers = layers;
v = sub_alloc(idp, &id, pa);
if (v == -2)
goto build_up;
sub_alloc函数。
还是以示意图为例讲述。我们是两层的结构,p是32叉树的根节点top
如果用户要分配大于等于66的id,66=2*32+2,首先找到了我们要找的66是位于top->ary[2],我们需要确认 根的ary[2]这个分支是否还能分配。如果p->ary[2]对应的idr_layer 所有的槽位都分配出去了,客满,新的顾客无法入住,我们就不必白费劲去ary[2]这个分支去分配了。判断的办法就是m = find_next_bit(&bm, IDR_SIZE, n);这个函数很可爱,就是说我要找大于2 的所有分支,寻找第一个没有客满的分支。通过top层或者中间层bitmap的含义,如果某个分支全部客满,则在对应bitmap位置1 ,表示,不要去这个分支找了,找也白找。
然后一层层往下找,知道找到叶子层,在叶子层查找大于等于2的id。
各种情况我就不分析了,大家可以自己尝试分配一下:
- 从0开始,分配,累加到33,差不多就可以理解idr_get_new这种情况的分配流程
- 不按常理出牌,乱分配,假如我第一个就要分配 大于37的,第二次就要分配大于1500的,之类的,
在走一遍流程,就可以理解相关的代码。
while (1) {
/*
* We run around this while until we reach the leaf node...
*/
n = (id >> (IDR_BITS*l)) & IDR_MASK;
bm = ~p->bitmap;
m = find_next_bit(&bm, IDR_SIZE, n);
if (m == IDR_SIZE) {
/* no space available go back to previous layer. */
l++;
oid = id;
id = (id | ((1 << (IDR_BITS * l)) - 1)) + 1;
/* if already at the top layer, we need to grow */
if (!(p = pa[l])) {
*starting_id = id;
return -2;
}
/* If we need to go up one layer, continue the
* loop; otherwise, restart from the top.
*/
sh = IDR_BITS * (l + 1);
if (oid >> sh == id >> sh)
continue;
else
goto restart;
}
if (m != n) {
sh = IDR_BITS*l;
id = ((id >> sh) ^ n ^ m) << sh;
}
if ((id >= MAX_ID_BIT) || (id < 0))
return -3;
if (l == 0)
break;
/*
* Create the layer below if it is missing.
*/
if (!p->ary[m]) {
if (!(new = alloc_layer(idp)))
return -1;
p->ary[m] = new;
p->count++;
}
pa[l--] = p;
p = p->ary[m];
}