`
zhouwenjian
  • 浏览: 14094 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

Java hashcode 与 equals的关系

 
阅读更多

先来看能表明hashcode和equals的关系的几句话:

equals()相等的两个对象,hashcode()一定相等;

equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。

反过来:

hashcode()不等,一定能推出equals()也不等;

hashcode()相等,equals()可能相等,也可能不等。

我觉得这样表达两者之间的关系,对程序员来说起不到一点作用,充其量在考试时能做对题目。

我尝试用下边的方法解释两者之间的关系。

首先,应该知道什么是hash表,假如有:10,11,13,14,18,22,27这几个数字,hash算法的目的就是快速的为每个数字分区,存入相应的分区后,以后找起来能更快速。

那么假设hash算法对5取余数,那么数字10,余数0,放在0的位置,数字11,余数1,放在1的位置,其余一次类推。结果如上图所示。

在java中hash算法主要用在集合上,如hashset,hashmap。

我们都知道set有一个特性,就是可与用于过滤相同值的操作,有点类似与SQL中distinct关键字一样。相同的对象,在第2次add进hashset中,由于两次add的是相同的对象,所以,第二次的add未起作用。

如果当前set中已经有1万个不同对象了,那么再添加一个对象时,该怎么判断?判断1万次是否已经含有将要添加到set中的值?显然不会那么做。用什么方法比较才能快速的比较出新添加的数据是不是Set中已经有的数据呢?那么这就用到了hashcode。

再将每一个对象插入hashset之前,首先先算出该对象的hashcode,将要存入hashset的对象只跟具有相同hashcode的元素进行equals比较。此处的hashcode可以对应上图的0,1,2,3,4.

现在依次add3个数字,分别是13,18,27,我们把他们看成3个对象,他们的hashcode都等于3(假设hashcode的算法是数字对5取余的话),所以都应放入3区域,而且他们3个经过equals比较是不相等的,所以3个数字都逐次的存入3区域了。

假如再add一下18的话,首先算hashcode,等于3,然后去3对应的区域将每个元素都用equals比较一遍,显然已经有18了,所以18不再被添加如hashset。这样通过先算出hashcode,然后将要做比较的范围缩小了(再次添加的18,只需和3区域的13、18、27比较),是不是加快速度了呢?

现在,对照图片我们很容易理解文章开头说的那几句话。

1.equals()相等的两个对象,hashcode()一定相等;

两次添加18,他们是相等的对象,肯定能推出hashcode相等,正因为有了hashcode相等这个事实,所以才有了第2次的18被分配到3区域与原来的18比较的机会。

2.equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。

对照数字13,18,27。 13和18,27是互不相等的对象,但是hashcode却相等

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics