java 中hashcode 与 equals的关系

先来看能表明hashcode和equals的关系的几句话:

equals()相等的两个对象,hashcode()一定相等;

equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。

反过来:

hashcode()不等,一定能推出equals()也不等;

hashcode()相等,equals()可能相等,可能不等。

我觉得这样表达两者之间的关系,对程序员来说起不到一点作用,充其量在考试时能做对题目。

我尝试用下边的方法解释两者之间的关系。

 

 

 

        首先,应该知道什么是hash表,假如有:10,11,13,14,18,22,27这几个数字,hash算法的目的就是快速的为每个数字分区,存入相应的分区后,以后找起来能更快速。

        那么假设hash算法对5取余数,那么数字10,余数0,放在0的位置,数字11,余数1,放在1的位置,其余一次类推。结果如上图所示。

       在java中hash算法主要用在集合上,如hashset,hashmap。

        我们都知道set有一个特性,就是可与用于过滤相同值的操作,有点类似与SQL中distinct关键字一样。相同的对象,在第2次add进hashset中,由于两次add的是相同的对象,所以,第二次的add未起作用。

       如果当前set中已经有1万个不同对象了,那么再添加一个对象时,该怎么判断?判断1万次是否已经含有将要添加到set中的值?显然不会那么做。用什么方法比较才能快速的比较出新添加的数据是不是Set中已经有的数据呢?那么这就用到了hashcode。

       再将每一个对象插入hashset之前,首先先算出该对象的hashcode,将要存入hashset的对象只跟具有相同hashcode的元素进行equals比较。此处的hashcode可以对应上图的0,1,2,3,4. 

 

 

       现在依次add3个数字,分别是13,18,27,我们把他们看成3个对象,他们的hashcode都等于3(假设hashcode的算法是数字对5取余的话),所以都应放入3区域,而且他们3个经过equals比较是不相等的,所以3个数字都逐次的存入3区域了。

       假如再add一下18的话,首先算hashcode,等于3,然后去3对应的区域将每个元素都用equals比较一遍,显然已经有18了,所以18不再被添加如hashset。这样通过先算出hashcode,然后将要做比较的范围缩小了(再次添加的18,只需和3区域的13、18、27比较),是不是加快速度了呢?

 

        现在,对照图片我们很容易理解文章开头说的那几句话。

        1.equals()相等的两个对象,hashcode()一定相等;        

                两次添加18,他们是相等的对象,肯定能推出hashcode相等,正因为有了hashcode相等这

                个事实,所以才有了第2次的18被分配到3区域与原来的18比较的机会。

        2.equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。

                对照数字13,18,27。   

               13和18,27是互不相等的对象,但是hashcode却相等

        那么,如果我们的hashcode的算法如果变了呢?比如:我覆盖了Object的hashcode和equals方法,先前的hashcode的算法和我现在hashcode的算法不同时,会出现什么样的情况呢??

posted @ 2012-07-22 13:46  大雪先生  阅读(898)  评论(1编辑  收藏  举报