.NET面试题系列(12)Dictionary原理
序言
Dictionary的构造
下面的代码我看看Dictionary在构造时都做了什么:
private void Initialize(int capacity) { int prime = HashHelpers.GetPrime(capacity); this.buckets = new int[prime]; for (int i = 0; i < this.buckets.Length; i++) { this.buckets[i] = -1; } this.entries = new Entry<TKey, TValue>[prime]; this.freeList = -1; }
我们看到,Dictionary在构造的时候做了以下几件事:
-
初始化一个this.buckets = new int[prime]
-
初始化一个this.entries = new Entry<TKey, TValue>[prime]
-
Bucket和entries的容量都为大于字典容量的一个最小的质数
其中this.buckets主要用来进行Hash碰撞,this.entries用来存储字典的内容,并且标识下一个元素的位置。
Hash冲突
哈希表的结构改良方法主要包括“链式地址”和“开放寻址”。
处理Hash冲突的方法中,通常有开放定址法、再Hash法、链地址法、建立一个公共溢出区等。Dictionary使用的是 链地址法 又称 拉链法。
下图 Hash冲突示意图:
Sandra Dee
和 John Smith
通过hash函数 运算后都落到了02
的位置,产生了碰撞和冲突。
拉链法:将产⽣冲突的元素建⽴⼀个单链表,并将头指针地址存储⾄Hash表对应桶的位置。这样定位到Hash桶的位置后可通过遍历单链表的形式来查找元素。
数组内的元素通过next(下一个元素的索引)形成一个单链表。
总结
Dictionary由数组构成,Hash函数作为地址构建,拉链法解决Hash冲突。Dictionary也是线程不安全的,因此在多线程访问的时候,需要自行加lock处理。
资料
https://www.hello-algo.com/chapter_hashing/hash_map/
https://referencesource.microsoft.com/#mscorlib/system/collections/generic/dictionary.cs,814a5437516f7e8b
https://www.cnblogs.com/InCerry/p/10325290.html
https://blog.csdn.net/zhaoguanghui2012/article/details/88105715
https://www.cnblogs.com/zhaolaosan/p/16244067.html