1. 首先equals()和hashcode()這兩個(gè)方法都是從object類中繼承過(guò)來(lái)的。
equals()方法在object類中定義如下:
public boolean equals(Object obj) {
return (this == obj);
}
很明顯是對(duì)兩個(gè)對(duì)象的地址值進(jìn)行的比較(即比較引用是否相同)。但是我們必需清楚,當(dāng)String 、Math、還有Integer、Double。。。。等這些封裝類在使用equals()方法時(shí),已經(jīng)覆蓋了object類的equals()方法。比如在String類中如下:
public boolean equals(Object anObject) {
if (this == anObject) {
return true;
}
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = count;
if (n == anotherString.count) {
char v1[] = value;
char v2[] = anotherString.value;
int i = offset;
int j = anotherString.offset;
while (n-- != 0) {
if (v1[i++] != v2[j++])
return false;
}
return true;
}
}
return false;
}
很明顯,這是進(jìn)行的內(nèi)容比較,而已經(jīng)不再是地址的比較。依次類推Double、Integer、Math。。。。等等這些類都是重寫(xiě)了equals()方法的,從而進(jìn)行的是內(nèi)容的比較。當(dāng)然了基本類型是進(jìn)行值的比較,這個(gè)沒(méi)有什么好說(shuō)的。
我們還應(yīng)該注意,Java語(yǔ)言對(duì)equals()的要求如下,這些要求是必須遵循的:
• 對(duì)稱性:如果x.equals(y)返回是“true”,那么y.equals(x)也應(yīng)該返回是“true”。
• 反射性:x.equals(x)必須返回是“true”。
• 類推性:如果x.equals(y)返回是“true”,而且y.equals(z)返回是“true”,那么z.equals(x)也應(yīng)該返回是“true”。
• 還有一致性:如果x.equals(y)返回是“true”,只要x和y內(nèi)容一直不變,不管你重復(fù)x.equals(y)多少次,返回都是“true”。
• 任何情況下,x.equals(null),永遠(yuǎn)返回是“false”;x.equals(和x不同類型的對(duì)象)永遠(yuǎn)返回是“false”。
以上這五點(diǎn)是重寫(xiě)equals()方法時(shí),必須遵守的準(zhǔn)則,如果違反會(huì)出現(xiàn)意想不到的結(jié)果,請(qǐng)大家一定要遵守。
2. 其次是hashcode() 方法,在object類中定義如下:
public native int hashCode();
說(shuō)明是一個(gè)本地方法,它的實(shí)現(xiàn)是根據(jù)本地機(jī)器相關(guān)的。當(dāng)然我們可以在自己寫(xiě)的類中覆蓋hashcode()方法,比如String、Integer、Double。。。。等等這些類都是覆蓋了hashcode()方法的。例如在String類中定義的hashcode()方法如下:
public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;
for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}
解釋一下這個(gè)程序(String的API中寫(xiě)到):
s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
使用 int 算法,這里 s[i] 是字符串的第 i 個(gè)字符,n 是字符串的長(zhǎng)度,^ 表示求冪。(空字符串的哈希碼為 0。)
首先,想要明白hashCode的作用,你必須要先知道Java中的集合?! ?br>總的來(lái)說(shuō),Java中的集合(Collection)有兩類,一類是List,再有一類是Set。
你知道它們的區(qū)別嗎?前者集合內(nèi)的元素是有序的,元素可以重復(fù);后者元素?zé)o序,但元素不可重復(fù)。
那么這里就有一個(gè)比較嚴(yán)重的問(wèn)題了:要想保證元素不重復(fù),可兩個(gè)元素是否重復(fù)應(yīng)該依據(jù)什么來(lái)判斷呢?
這就是Object.equals方法了。但是,如果每增加一個(gè)元素就檢查一次,那么當(dāng)元素很多時(shí),后添加到集合中的元素比較的次數(shù)就非常多了。
也就是說(shuō),如果集合中現(xiàn)在已經(jīng)有1000個(gè)元素,那么第1001個(gè)元素加入集合時(shí),它就要調(diào)用1000次equals方法。這顯然會(huì)大大降低效率。
于是,Java采用了哈希表的原理。哈希(Hash)實(shí)際上是個(gè)人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。
哈希算法也稱為散列算法,是將數(shù)據(jù)依特定算法直接指定到一個(gè)地址上。如果詳細(xì)講解哈希算法,那需要更多的文章篇幅,我在這里就不介紹了。
初學(xué)者可以這樣理解,hashCode方法實(shí)際上返回的就是對(duì)象存儲(chǔ)的物理地址(實(shí)際可能并不是)。
這樣一來(lái),當(dāng)集合要添加新的元素時(shí),先調(diào)用這個(gè)元素的hashCode方法,就一下子能定位到它應(yīng)該放置的物理位置上。
如果這個(gè)位置上沒(méi)有元素,它就可以直接存儲(chǔ)在這個(gè)位置上,不用再進(jìn)行任何比較了;如果這個(gè)位置上已經(jīng)有元素了,
就調(diào)用它的equals方法與新元素進(jìn)行比較,相同的話就不存了,不相同就散列其它的地址。
所以這里存在一個(gè)沖突解決的問(wèn)題。這樣一來(lái)實(shí)際調(diào)用equals方法的次數(shù)就大大降低了,幾乎只需要一兩次。
所以,Java對(duì)于eqauls方法和hashCode方法是這樣規(guī)定的:
1、如果兩個(gè)對(duì)象相同,那么它們的hashCode值一定要相同;2、如果兩個(gè)對(duì)象的hashCode相同,它們并不一定相同 上面說(shuō)的對(duì)象相同指的是用eqauls方法比較。
你當(dāng)然可以不按要求去做了,但你會(huì)發(fā)現(xiàn),相同的對(duì)象可以出現(xiàn)在Set集合中。同時(shí),增加新元素的效率會(huì)大大下降。
3.這里我們首先要明白一個(gè)問(wèn)題:
equals()相等的兩個(gè)對(duì)象,hashcode()一定相等;
equals()不相等的兩個(gè)對(duì)象,卻并不能證明他們的hashcode()不相等。換句話說(shuō),equals()方法不相等的兩個(gè)對(duì)象,hashcode()有可能相等。(我的理解是由于哈希碼在生成的時(shí)候產(chǎn)生沖突造成的)。
反過(guò)來(lái):hashcode()不等,一定能推出equals()也不等;hashcode()相等,equals()可能相等,也可能不等。解釋下第3點(diǎn)的使用范圍,我的理解是在object、String等類中都能使用。在object類中,hashcode()方法是本地方法,返回的是對(duì)象的地址值,而object類中的equals()方法比較的也是兩個(gè)對(duì)象的地址值,如果equals()相等,說(shuō)明兩個(gè)對(duì)象地址值也相等,當(dāng)然hashcode()也就相等了;在String類中,equals()返回的是兩個(gè)對(duì)象內(nèi)容的比較,當(dāng)兩個(gè)對(duì)象內(nèi)容相等時(shí),
Hashcode()方法根據(jù)String類的重寫(xiě)(第2點(diǎn)里面已經(jīng)分析了)代碼的分析,也可知道hashcode()返回結(jié)果也會(huì)相等。以此類推,可以知道Integer、Double等封裝類中經(jīng)過(guò)重寫(xiě)的equals()和hashcode()方法也同樣適合于這個(gè)原則。當(dāng)然沒(méi)有經(jīng)過(guò)重寫(xiě)的類,在繼承了object類的equals()和hashcode()方法后,也會(huì)遵守這個(gè)原則。
4.談到hashcode()和equals()就不能不說(shuō)到hashset,hashmap,hashtable中的使用,具體是怎樣呢,請(qǐng)看如下分析:
Hashset是繼承Set接口,Set接口又實(shí)現(xiàn)Collection接口,這是層次關(guān)系。那么hashset是根據(jù)什么原理來(lái)存取對(duì)象的呢?
在hashset中不允許出現(xiàn)重復(fù)對(duì)象,元素的位置也是不確定的。在hashset中又是怎樣判定元素是否重復(fù)的呢?這就是問(wèn)題的關(guān)鍵所在,經(jīng)過(guò)一下午的查詢求證終于獲得了一點(diǎn)啟示,和大家分享一下,在java的集合中,判斷兩個(gè)對(duì)象是否相等的規(guī)則是:
1),判斷兩個(gè)對(duì)象的hashCode是否相等
如果不相等,認(rèn)為兩個(gè)對(duì)象也不相等,完畢
如果相等,轉(zhuǎn)入2)
(這一點(diǎn)只是為了提高存儲(chǔ)效率而要求的,其實(shí)理論上沒(méi)有也可以,但如果沒(méi)有,實(shí)際使用時(shí)效率會(huì)大大降低,所以我們這里將其做為必需的。后面會(huì)重點(diǎn)講到這個(gè)問(wèn)題。)
2),判斷兩個(gè)對(duì)象用equals運(yùn)算是否相等
如果不相等,認(rèn)為兩個(gè)對(duì)象也不相等
如果相等,認(rèn)為兩個(gè)對(duì)象相等(equals()是判斷兩個(gè)對(duì)象是否相等的關(guān)鍵)
為什么是兩條準(zhǔn)則,難道用第一條不行嗎?不行,因?yàn)榍懊嬉呀?jīng)說(shuō)了,hashcode()相等時(shí),equals()方法也可能不等,所以必須用第2條準(zhǔn)則進(jìn)行限制,才能保證加入的為非重復(fù)元素。
比如下面的代碼:
public static void main(String args[]){
String s1=new String("zhaoxudong");
String s2=new String("zhaoxudong");
System.out.println(s1==s2);//false
System.out.println(s1.equals(s2));//true
System.out.println(s1.hashCode());//s1.hashcode()等于s2.hashcode()
System.out.println(s2.hashCode());
Set hashset=new HashSet();
hashset.add(s1);
hashset.add(s2);
/*實(shí)質(zhì)上在添加s1,s2時(shí),運(yùn)用上面說(shuō)到的兩點(diǎn)準(zhǔn)則,可以知道hashset認(rèn)為s1和s2是相等的,是在添加重復(fù)元素,所以讓s2覆蓋了s1;*/
Iterator it=hashset.iterator();
while(it.hasNext())
{
System.out.println(it.next());
}
最后在while循環(huán)的時(shí)候只打印出了一個(gè)”zhaoxudong”。
輸出結(jié)果為:false
true
-967303459
-967303459
這是因?yàn)镾tring類已經(jīng)重寫(xiě)了equals()方法和hashcode()方法,所以在根據(jù)上面的第1.2條原則判定時(shí),hashset認(rèn)為它們是相等的對(duì)象,進(jìn)行了重復(fù)添加。
但是看下面的程序:
import java.util.*;
public class HashSetTest
{
public static void main(String[] args)
{
HashSet hs=new HashSet();
hs.add(new Student(1,"zhangsan"));
hs.add(new Student(2,"lisi"));
hs.add(new Student(3,"wangwu"));
hs.add(new Student(1,"zhangsan"));
Iterator it=hs.iterator();
while(it.hasNext())
{
System.out.println(it.next());
}
}
}
class Student
{
int num;
String name;
Student(int num,String name)
{
this.num=num;
this.name=name;
}
public String toString()
{
return num+":"+name;
}
}
輸出結(jié)果為:
1:zhangsan
1:zhangsan
3:wangwu
2:lisi
問(wèn)題出現(xiàn)了,為什么hashset添加了相等的元素呢,這是不是和hashset的原則違背了呢?回答是:沒(méi)有
因?yàn)樵诟鶕?jù)hashcode()對(duì)兩次建立的new Student(1,"zhangsan")對(duì)象進(jìn)行比較時(shí),生成的是不同的哈希碼值,所以hashset把他當(dāng)作不同的對(duì)象對(duì)待了,當(dāng)然此時(shí)的equals()方法返回的值也不等(這個(gè)不用解釋了吧)。那么為什么會(huì)生成不同的哈希碼值呢?上面我們?cè)诒容^s1和s2的時(shí)候不是生成了同樣的哈希碼嗎?原因就在于我們自己寫(xiě)的Student類并沒(méi)有重新自己的hashcode()和equals()方法,所以在比較時(shí),是繼承的object類中的hashcode()方法,呵呵,各位還記得object類中的hashcode()方法比較的是什么吧?。?
它是一個(gè)本地方法,比較的是對(duì)象的地址(引用地址),使用new方法創(chuàng)建對(duì)象,兩次生成的當(dāng)然是不同的對(duì)象了(這個(gè)大家都能理解吧。。。),造成的結(jié)果就是兩個(gè)對(duì)象的hashcode()返回的值不一樣。所以根據(jù)第一個(gè)準(zhǔn)則,hashset會(huì)把它們當(dāng)作不同的對(duì)象對(duì)待,自然也用不著第二個(gè)準(zhǔn)則進(jìn)行判定了。那么怎么解決這個(gè)問(wèn)題呢??
答案是:在Student類中重新hashcode()和equals()方法。
例如:
class Student
{
int num;
String name;
Student(int num,String name)
{
this.num=num;
this.name=name;
}
public int hashCode()
{
return num*name.hashCode();
}
public boolean equals(Object o)
{
Student s=(Student)o;
return num==s.num && name.equals(s.name);
}
public String toString()
{
return num+":"+name;
}
}
根據(jù)重寫(xiě)的方法,即便兩次調(diào)用了new Student(1,"zhangsan"),我們?cè)讷@得對(duì)象的哈希碼時(shí),根據(jù)重寫(xiě)的方法hashcode(),獲得的哈希碼肯定是一樣的(這一點(diǎn)應(yīng)該沒(méi)有疑問(wèn)吧)。
當(dāng)然根據(jù)equals()方法我們也可判斷是相同的。所以在向hashset集合中添加時(shí)把它們當(dāng)作重復(fù)元素看待了。所以運(yùn)行修改后的程序時(shí),我們會(huì)發(fā)現(xiàn)運(yùn)行結(jié)果是:
1:zhangsan
3:wangwu
2:lisi
可以看到重復(fù)元素的問(wèn)題已經(jīng)消除。
關(guān)于在hibernate的pojo類中,重新equals()和hashcode()的問(wèn)題:
1),重點(diǎn)是equals,重寫(xiě)hashCode只是技術(shù)要求(為了提高效率)
2),為什么要重寫(xiě)equals呢,因?yàn)樵趈ava的集合框架中,是通過(guò)equals來(lái)判斷兩個(gè)對(duì)象是否相等的
3),在hibernate中,經(jīng)常使用set集合來(lái)保存相關(guān)對(duì)象,而set集合是不允許重復(fù)的。我們?cè)賮?lái)談?wù)勄懊嫣岬皆谙騢ashset集合中添加元素時(shí),怎樣判斷對(duì)象是否相同的準(zhǔn)則,前面說(shuō)了兩條,其實(shí)只要重寫(xiě)equals()這一條也可以。
但當(dāng)hashset中元素比較多時(shí),或者是重寫(xiě)的equals()方法比較復(fù)雜時(shí),我們只用equals()方法進(jìn)行比較判斷,效率也會(huì)非常低,所以引入了hashcode()這個(gè)方法,只是為了提高效率,但是我覺(jué)得這是非常有必要的(所以我們?cè)谇懊嬉詢蓷l準(zhǔn)則來(lái)進(jìn)行hashset的元素是否重復(fù)的判斷)。
比如可以這樣寫(xiě):
public int hashCode(){
return 1;}//等價(jià)于hashcode無(wú)效
這樣做的效果就是在比較哈希碼的時(shí)候不能進(jìn)行判斷,因?yàn)槊總€(gè)對(duì)象返回的哈希碼都是1,每次都必須要經(jīng)過(guò)比較equals()方法后才能進(jìn)行判斷是否重復(fù),這當(dāng)然會(huì)引起效率的大大降低。
我有一個(gè)問(wèn)題,如果像前面提到的在hashset中判斷元素是否重復(fù)的必要方法是equals()方法(根據(jù)網(wǎng)上找到的觀點(diǎn)),但是這里并沒(méi)有涉及到關(guān)于哈希表的問(wèn)題,可是這個(gè)集合卻叫hashset,這是為什么??
我想,在hashmap,hashtable中的存儲(chǔ)操作,依然遵守上面的準(zhǔn)則。所以這里不再多說(shuō)。這些是今天看書(shū),網(wǎng)上查詢資料,自己總結(jié)出來(lái)的,部分代碼和語(yǔ)言是引述,但是千真萬(wàn)確是自己總結(jié)出來(lái)的。有錯(cuò)誤之處和不詳細(xì)不清楚的地方還請(qǐng)大家指出,我也是初學(xué)者,所以難免會(huì)有錯(cuò)誤的地方,希望大家共同討論
聯(lián)系客服