Python 字典和集合基于哈希表实现
哈希表作为基础数据结构我不多说,有兴趣的可以百度,或者等我出一篇博客来细谈哈希表。我这里就简单讲讲:哈希表不过就是一个定长数组,元素找位置,遇到哈希冲突则利用 hash 算法解决找另一个位置,如果数组长度不够用则进行扩容,然后不断地循环反复。
我们提到了字典和集合是由哈希表实现的,具体的实现过程是怎么样的呢?
其实很简单,字典里面有取值,添加值,正好对应的就是哈希表中的find和add方法。使用__getitem__和__setitem__代替两者就可以了。然后对于keys,values取值,只需要遍历循环就行了。
这里需要注意一点,由于字典是由哈希表实现的,那么字典的key值就必须是可哈希的,否则该key值无法用哈希函数进行解析。
而集合其实就是字典,在字典的基础上把所有key对应的value的值赋值1就行了,至于集合的各种方法,使用for循环判断就行了。
再说说个人对可变类型不可哈希的原因,因为使用哈希函数的时候,如果对一个可变类型进行哈希,那么原数据类型会得到相应的改变。并且由于哈希表的数据结构是在不断地在哈希冲突然后通过某种hash算法重新找位置的,如果在某个位置上这个值是个可变类型,那么可能在稳定的哈希结构中造成冲突,即破坏了已经稳定的哈希结构。