小议GetHashCode()方法

重写GetHashCode()方法必须遵循如下三条规则：
1，如果两个对象相等，它们必须产生相同的散列码
2，对于任意对象o,o.GetHashCode()必须是一个实例不变式，也就是说无论在o上调用什么方法，o.GetHashCode()必须返回同样的值。
3，散列函数应该在所有整数中产生一个随机的分布，这样才能获得效率的提升

下面我说说GetHashCode()方法的默认实现：

对于引用类型来说，他们的GetHashCode实现是直接继承了Object.GetHashCode()的实现，Object.GetHashCode()使用Object的一个内部字段（对象标识字段）来产生散列值。从1开始，每创建一个新对象，这个字段也随之增长，这个字段在构造器中设置，设置之后就不能更改了，对一个给定对象，就使用这个字段的值作为散列值。
对照上面的规则：
对于规则1，默认情况下，两个对象相等意味着引用同一个对象，既然是同一个对象，对象标识字段也一样，所以这个默认的实现可以满足规则1。
对于规则2，对象标识字段设置后就不能改变了，所以这个默认的实现可以满足规则2。
对于规则3，除非你创建了大量的对象，不然生成的散列码不可能随机分布

对于值类型来说，值类型都是继承于ValueType的，而ValueType重写了GetHashCode()方法，默认的实现会返回类型中第一个字段的散列值作为对象的散列值。
对照上面的规则：
对于规则1，默认情况下，如果两个值类型实例相等，那么它们的每一个字段都相等，当然第一个字段也相等，第一个字段的散列值也就相等，默认的实现是返回类型中第一个字段的散列值作为对象的散列值，所以这个默认的实现可以满足规则1
对于规则2，除非第一个字段是常量，否则默认的实现不能满足规则2
对于规则3，主要看第一个字段的GetHashCode()方法是否满足规则3

总结：
在默认情况下，引用类型的GetHashCode()方法的实现可以正确的工作，但是效率低下，基于效率方面的考虑，可以重写默认的实现；
在默认情况下，值类型的GetHashCode()方法的实现常常是不正确的，建议重写默认的实现。

posted on 2009-08-16 21:46 周雪峰阅读(465) 评论(0) 编辑收藏举报

小议GetHashCode()方法

搜索

常用链接

随笔档案

相册

阅读排行榜

评论排行榜

推荐排行榜

最新评论