数组作链表

一般传统链表的物理结构,是由指针把一个一个的节点相互连接而成:

struct node
{
DataType data;
node* previous;
node* next;
}

其特点是按需分配节点,灵活动态增长。

但是此外,还有另外一种方式是使用数组实现链表,这里所有的node都在预先分配好的数组中,不使用指针,而是用数组下标来指向前一个、下一个元素:

struct node
{
DataType data;
int previous;
int next;
}

其特点是预先分配节点,并且如果需要链表长度随需增加,需要reallocation ,和vector类似。

下面就我自己的一些了解,谈一下其优缺点与应用。

数组作链表有哪些优点

能要省些内存吗?不见得;速度要快吗?没看出来,那么为什么要使用这种不那么直观的方式来实现链表呢?

  • 数组的内存布局比较紧凑,能占些局部性原理的光
  • 在不提供指针的语言中实现链表结构,如vb等
  • 进程间通信,使用index比使用指针是要靠谱 - 一个进程中的指针地址在另外一个进程中是没有意义的
  • 对一些内存奇缺应用,当其值类型为整型,且值域与数组index相符时,可以将next指针与data复用,从而节省一些内存
  • 整存零取,防止内存碎片的产生(多谢Emacs补充)

实现与应用

Id allocator

这里第一个例子针对上面第四点展开,其主要的应用在于ID的分配与回收,比如数据库表中的每条记录都需要一个unique id,当你增增减减若干次之后,然后新建一个表项,你该分配给它哪个id呢?

  • 维持一个id,每增加一行就加1,删行不回收id --- 这样id会无限增加,太浪费了
  • 每次分配都遍历一遍,找到最小的那个还没被用过的id --- 这样太浪费时间了
一个比较合理的做法是维护一个“可用ID”的链表,每次增加就从链表中拿一个,每次删除就把被删的ID链接到链表中,但是,对于传统链表结构而言,其节点的定义类似于: 
struct idnode
{
int availableID;
idnode* next;
};
这里,因为链表的值的类型与值域都与数组的index相符,我们可以复用其值和next,从而只需一个int数组,而不是一个idnode数组,数组中某个元素的值代表的即是链表节点的值,也是链表的下一个节点下标。下面是一个idallocator的实现,主要提供allocate和free两个函数用来满足上述要求:
const static char LIST_END = -1;
template < typename integer>
class idallocator
{
public:
idallocator(int _num): num(_num)
{
array = new integer[num];
// Initialize the linked list. Initially, it is a full linked list with all elements linked one after another.
head = 0;
for (integer i = 0; i < num; i++)
{
array[i] = i + 1;
}
array[num-1] = LIST_END;
count = num;
}
~idallocator()
{
delete [] array;
}
integer allocate() // pop_front, remove a node from the front
{
int id = head;
if(id != LIST_END)
{
head = array[head];
count--;
}
return id;
}
// push_front, add a new node to the front
void free(const integer& id) 
{
array[id] = head;
count++;
head = id;
}
// push_front, add a new node to the front
bool free_s(const integer& id) 
{
// make sure this id is not in the list before we add it
if(exist(id)) return false; 
free(id);
return true;
}
size_t size()
{
return count;
}
private:
bool exist(const integer& id)
{
int i = head;
while (i != LIST_END)
{
if(i == id) return true;
i = array[i];
}
return false;
}
private:
integer* array;
int num;// totall number of the array
int count;// number in the linked list
int head;// index of the head of the linked list
};

Double linked list

用数组实现链表,大多数情况下,是与传统链表类似的,无非是在添加、删除节点后,调整previous,next域的指向。但是有一点,当我在添加一个新的节点时,如何从数组中拿到一个还未被使用过的节点呢?这里有两种方法:

  • 如果你看懂了上面的id allocator,你也许已经意识到,使用上面那个idallocator类就可以简单的实现这个需求
  • 另外一种方法,其实原理上也类似,就是在这个double linked list类中维护两个链表,一个是已使用的,一个是未使用的
第一种因为借助于一个工具类,实现看起来会简洁很多,但是idallocator会消耗额外的内存,因此第二种方法相对来讲会比较好。

这里有个粗略的实现:arraylist

参考

posted @ 2010-08-22 08:05  lzprgmr  阅读(8921)  评论(10编辑  收藏  举报

黄将军