Linux内核 - 哈希链表及其变种

http://blog.csdn.net/zhangskd/article/details/11225301


前言

 

先来直观的比较下普通链表和哈希链表:

 

 

普通链表

 

普通链表的表头和节点相同

  1. struct list_head {  
  2.     struct list_head *next, *prev;  
  3. };  

 

哈希链表

 

哈希链表头

  1. struct hlist_head {  
  2.     struct hlist_node *first;  
  3. };  

哈希链表节点

  1. struct hlist_node {  
  2.     struct hlist_node *next, **pprev;  
  3. };  

 

设计原理

 

Linux链表设计者认为双指针表头双循环链表对于HASH表来说过于浪费,因而另行设计了一套用于HASH表的hlist数据结构

即单指针表头双循环链表。hlist表头仅有一个指向首节点的指针,而没有指向尾节点的指针,这样在海量的HASH表中存储

的表头就能减少一半的空间消耗。

 

这里还需要注意:struct hlist_node **pprev,也就是说pprev是指向前一个节点(也可以是表头)中next指针的指针。

Q:为什么不使用struct hlist_node *prev,即让prev指向前一个节点呢?

A:因为这时候表头(hlist_head)和节点(hlist_node)的数据结构不同。如果使用struct hlist_node *prev,只适用于前一个为节点

的情况,而不适用于前一个为表头的情况。如果每次操作都要考虑指针类型转换,会是一件麻烦的事情。

所以,我们需要一种统一的操作,而不用考虑前一个元素是节点还是表头。

struct hlist_node **pprev,pprev指向前一个元素的next指针,不用管前一个元素是节点还是表头。

当我们需要操作前一个元素(节点或表头),可以统一使用*(node->pprev)来访问和修改前一元素的next(或first)指针。

 

原理图如下:

 

 

常用操作

 

(1) 初始化

  1. /* 
  2.  * Double linked lists with a single pointer list head. 
  3.  * Mostly useful for hash tables where the two pointer list head is too wasteful. 
  4.  * You lose the ability to access the tail in O(1). 
  5.  */  
  6. #define HLIST_HEAD_INIT { .first = NULL }  
  7. #define HLIST_HEAD (name) struct hlist_head name = { .first = NULL }  
  8. #define INIT_HLIST_HEAD(ptr) ((ptr)->first = NULL)  

 

(2) 插入

  1. /* next must be != NULL */  
  2. static inline void hlist_add_before(struct hlist_node *n, struct hlist_node *next)  
  3. {  
  4.     n->pprev = next->pprev;  
  5.     n->next = next;  
  6.     next->pprev = &n->next;  
  7.     *(n->pprev) = n;  
  8. }  

 

(3) 删除

  1. static inline void __hlist_del(struct hlist_node *n)  
  2. {  
  3.     struct hlist_node *next = n->next;  
  4.     struct hlist_node **prev = n->pprev;  
  5.     *pprev = next;  
  6.     if (next)  
  7.         next->pprev = pprev;  
  8. }  

 

(4) 遍历

  1. #define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *) 0)->MEMBER)  
  2.   
  3. /* 
  4.  * container_of - cast a member of a structure out to the containing structure 
  5.  * @ptr: the pointer to the member. 
  6.  * @type: the type of the container struct this is embedded in. 
  7.  * @member: the name of the member within the struct. 
  8.  */  
  9. #define container_of(ptr, type, member) ({    \  
  10.     const typeof(((type *) 0)->member) * __mptr = (ptr);    \  
  11.     (type *) ((char *) __mptr - offsetof(type, member)); })  
  12.   
  13. #define hlist_entry(ptr, type, member) container_of(ptr, type, member)  
  14.   
  15. #define hlist_for_each(pos, head) \  
  16.     for (pos = (head)->first; pos; pos = pos->next)  
  17.    
  18. /** 
  19.  * hlist_for_each_entry - iterate over list of given type 
  20.  * @tpos: the type * to use as a loop cursor. 
  21.  * @pos: the &struct hlist_node to use a loop cursor. 
  22.  * @head: the head for your list. 
  23.  * @member: the name of the hlist_node within the struct. 
  24.  */  
  25. #define hlist_for_each_entry(tpos, pos, head, member)    \  
  26.     for (pos = (head)->first;    \  
  27.            pos && ({ tpos = hlist_entry(pos, typeof(*tpos), member); 1;});    \  
  28.            pos = pos->next)  

 

哈希链表变种

 

以下是作者的说明:

Special version of lists, where end of list is not a NULL pointer,

but a 'nulls' marker, which can have many different values.

(up to 2^31 different values guaranteed on all platforms)

In the standard hlist, termination of a list is the NULL pointer.

In this special 'nulls' variant, we use the fact the objects stored in

a list are aligned on a word (4 or 8 bytes alignment).

We therefore use the last significant bit of 'ptr':

Set to 1: This is a 'nulls' end-of-list maker (ptr >> 1)

Set to 0: This is a pointer to some object (ptr)

 

设计原理

 

当遍历标准的哈希链表时,如果节点为NULL,表示链表遍历完了。

哈希链表变种和标准哈希链表的区别是:链表的结束节点不是NULL。如果first或者next指针的最后一位为1,

就说明遍历到链表尾部了。

Q:为什么可以根据节点指针的最后一位是否为1来判断链表是否结束?

A:因为在一个结构体中,其元素是按4字节(32位机器)或者8字节(64位机器)对齐的。所以有效的节点指针的

      最后一位总是为0。因此我们可以通过把节点指针的最后一位置为1,来作为结束标志。

 

  1. /* 表头 */  
  2. struct hlist_nulls_head {  
  3.     struct hlist_nulls_node *first;  
  4. };  
  5.   
  6. /* 节点 */  
  7. struct hlist_nulls_node {  
  8.     struct hlist_nulls_node *next, **pprev;  
  9. };  

 

原理图如下:

 

 

常用操作

 

(1) 初始化

  1. #define INIT_HLIST_NULLS_HEAD(ptr, nulls)    \  
  2.     ((ptr)->first = (struct hlist_nulls_node *) (1UL | (((long) nulls) << 1)))  

 

(2) 判断是否为结束标志

  1. /* 
  2.  * ptr_is_a_nulls - Test if a ptr is a nulls 
  3.  * @ptr: ptr to be tested 
  4.  */  
  5. static inline int is_a_nulls(const struct hlist_nulls_node *ptr)  
  6. {  
  7.     return ((unsigned long) ptr & 1);  
  8. }  

 

(3) 获取结束标志

  1. /* 
  2.  * get_nulls_value - Get the 'nulls' value of the end of chain 
  3.  * @ptr: end of chain 
  4.  * Should be called only if is_a_nulls(ptr); 
  5.  */  
  6. static inline unsigned long get_nulls_value(const struct hlist_nulls_node *ptr)  
  7. {  
  8.     return ((unsigned long)ptr) >> 1;  
  9. }  

 

(4) 插入

把节点n插入为链表的第一个节点。

  1. static inline void hlist_nulls_add_head(struct hlist_nulls_node *n, struct hlist_nulls_head *h)  
  2. {  
  3.     struct hlist_nulls_node *first = h->first;  
  4.     n->next = first;  
  5.     n->pprev = &h->first;  
  6.     h->first = n;  
  7.     if (! is_a_nulls(first))  
  8.         first->pprev = &n->next;  
  9. }  

 

(5) 删除

  1. /* 
  2.  * These are non-NULL pointers that will result in page faults 
  3.  * under normal circumstances, used to verify that nobody uses 
  4.  * non-initialized list entries. 
  5.  */  
  6. #define LIST_POISON1 ((void *) 0x00100100 + POISON_POINTER_DELTA)  
  7. #define LIST_POISON2 ((void *) 0x00200200 + POISON_POINTER_DELTA)  
  8.   
  9. static inline void __hlist_nulls_del(struct hlist_nulls_node *n)  
  10. {  
  11.     struct hlist_nulls_node *next = n->next;  
  12.     struct hlist_nulls_node **pprev = n->pprev;  
  13.     *pprev = next;  
  14.     if (! is_a_nulls(next))  
  15.         next->pprev = pprev;  
  16. }  
  17.   
  18. static inline void hlist_nulls_del(struct hlist_nulls_node *n)  
  19. {  
  20.     __hlist_nulls_del(n);  
  21.     n->pprev = LIST_POISON2; /* 防止再通过n访问链表 */  
  22. }  

 

(6) 遍历

同标准哈希链表的基本一样。

hlist_nulls_for_each_entry(tpos, pos, head, member)

hlist_nulls_for_each_entry_from(tpos, pos, member)

 

Author

 

zhangskd @ csdn blog

 


posted @ 2016-10-02 17:37  张同光  阅读(358)  评论(0编辑  收藏  举报