App下載

解析Java對(duì)象在內(nèi)存空間中的構(gòu)成以及對(duì)象頭的概念

溫柔嘗盡了嗎 2021-08-10 14:57:06 瀏覽數(shù) (3742)
反饋

今天來(lái)講些抽象的東西 -- 對(duì)象頭,因?yàn)槲以趯W(xué)習(xí)的過(guò)程中發(fā)現(xiàn)很多地方都關(guān)聯(lián)到了對(duì)象頭的知識(shí)點(diǎn),例如JDK中的 synchronized鎖優(yōu)化 和 JVM 中對(duì)象年齡升級(jí)等等。要深入理解這些知識(shí)的原理,了解對(duì)象頭的概念很有必要,而且可以為后面分享 synchronized 原理和 JVM 知識(shí)的時(shí)候做準(zhǔn)備。

對(duì)象內(nèi)存構(gòu)成

Java 中通過(guò) new 關(guān)鍵字創(chuàng)建一個(gè)類的實(shí)例對(duì)象,對(duì)象存于內(nèi)存的堆中并給其分配一個(gè)內(nèi)存地址,那么是否想過(guò)如下這些問(wèn)題:

  • 這個(gè)實(shí)例對(duì)象是以怎樣的形態(tài)存在內(nèi)存中的?
  • 一個(gè)Object對(duì)象在內(nèi)存中占用多大?
  • 對(duì)象中的屬性是如何在內(nèi)存中分配的?

在 JVM 中,Java對(duì)象保存在堆中時(shí),由以下三部分組成:

  • 對(duì)象頭(object header):包括了關(guān)于堆對(duì)象的布局、類型、GC狀態(tài)、同步狀態(tài)和標(biāo)識(shí)哈希碼的基本信息。Java對(duì)象和vm內(nèi)部對(duì)象都有一個(gè)共同的對(duì)象頭格式。
  • 實(shí)例數(shù)據(jù)(Instance Data):主要是存放類的數(shù)據(jù)信息,父類的信息,對(duì)象字段屬性信息。
  • 對(duì)齊填充(Padding):為了字節(jié)對(duì)齊,填充的數(shù)據(jù),不是必須的。

對(duì)象頭

我們可以在Hotspot官方文檔中找到它的描述(下圖)。從中可以發(fā)現(xiàn),它是Java對(duì)象和虛擬機(jī)內(nèi)部對(duì)象都有的共同格式,由兩個(gè)字(計(jì)算機(jī)術(shù)語(yǔ))組成。另外,如果對(duì)象是一個(gè)Java數(shù)組,那在對(duì)象頭中還必須有一塊用于記錄數(shù)組長(zhǎng)度的數(shù)據(jù),因?yàn)樘摂M機(jī)可以通過(guò)普通Java對(duì)象的元數(shù)據(jù)信息確定Java對(duì)象的大小,但是從數(shù)組的元數(shù)據(jù)中無(wú)法確定數(shù)組的大小。

它里面提到了對(duì)象頭由兩個(gè)字組成,這兩個(gè)字是什么呢?我們還是在上面的那個(gè)Hotspot官方文檔中往上看,可以發(fā)現(xiàn)還有另外兩個(gè)名詞的定義解釋,分別是 mark word 和 klass pointer。

從中可以發(fā)現(xiàn)對(duì)象頭中那兩個(gè)字:第一個(gè)字就是 mark word,第二個(gè)就是 klass pointer。

Mark Word

用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID、偏向時(shí)間戳等等。

Mark Word在32位JVM中的長(zhǎng)度是32bit,在64位JVM中長(zhǎng)度是64bit。我們打開(kāi)openjdk的源碼包,對(duì)應(yīng)路徑/openjdk/hotspot/src/share/vm/oops,Mark Word對(duì)應(yīng)到C++的代碼markOop.hpp,可以從注釋中看到它們的組成,本文所有代碼是基于Jdk1.8。

Mark Word在不同的鎖狀態(tài)下存儲(chǔ)的內(nèi)容不同,在32位JVM中是這么存的

在64位JVM中是這么存的

雖然它們?cè)诓煌粩?shù)的JVM中長(zhǎng)度不一樣,但是基本組成內(nèi)容是一致的。

  • 鎖標(biāo)志位(lock):區(qū)分鎖狀態(tài),11時(shí)表示對(duì)象待GC回收狀態(tài), 只有最后2位鎖標(biāo)識(shí)(11)有效。
  • biased_lock:是否偏向鎖,由于無(wú)鎖和偏向鎖的鎖標(biāo)識(shí)都是 01,沒(méi)辦法區(qū)分,這里引入一位的偏向鎖標(biāo)識(shí)位。
  • 分代年齡(age):表示對(duì)象被GC的次數(shù),當(dāng)該次數(shù)到達(dá)閾值的時(shí)候,對(duì)象就會(huì)轉(zhuǎn)移到老年代。
  • 對(duì)象的hashcode(hash):運(yùn)行期間調(diào)用System.identityHashCode()來(lái)計(jì)算,延遲計(jì)算,并把結(jié)果賦值到這里。當(dāng)對(duì)象加鎖后,計(jì)算的結(jié)果31位不夠表示,在偏向鎖,輕量鎖,重量鎖,hashcode會(huì)被轉(zhuǎn)移到Monitor中。
  • 偏向鎖的線程ID(JavaThread):偏向模式的時(shí)候,當(dāng)某個(gè)線程持有對(duì)象的時(shí)候,對(duì)象這里就會(huì)被置為該線程的ID。 在后面的操作中,就無(wú)需再進(jìn)行嘗試獲取鎖的動(dòng)作。
  • epoch:偏向鎖在CAS鎖操作過(guò)程中,偏向性標(biāo)識(shí),表示對(duì)象更偏向哪個(gè)鎖。
  • ptr_to_lock_record:輕量級(jí)鎖狀態(tài)下,指向棧中鎖記錄的指針。當(dāng)鎖獲取是無(wú)競(jìng)爭(zhēng)的時(shí),JVM使用原子操作而不是OS互斥。這種技術(shù)稱為輕量級(jí)鎖定。在輕量級(jí)鎖定的情況下,JVM通過(guò)CAS操作在對(duì)象的標(biāo)題字中設(shè)置指向鎖記錄的指針。
  • ptr_to_heavyweight_monitor:重量級(jí)鎖狀態(tài)下,指向?qū)ο蟊O(jiān)視器Monitor的指針。如果兩個(gè)不同的線程同時(shí)在同一個(gè)對(duì)象上競(jìng)爭(zhēng),則必須將輕量級(jí)鎖定升級(jí)到Monitor以管理等待的線程。在重量級(jí)鎖定的情況下,JVM在對(duì)象的ptr_to_heavyweight_monitor設(shè)置指向Monitor的指針。

Klass Pointer

即類型指針,是對(duì)象指向它的類元數(shù)據(jù)的指針,虛擬機(jī)通過(guò)這個(gè)指針來(lái)確定這個(gè)對(duì)象是哪個(gè)類的實(shí)例。

實(shí)例數(shù)據(jù)

如果對(duì)象有屬性字段,則這里會(huì)有數(shù)據(jù)信息。如果對(duì)象無(wú)屬性字段,則這里就不會(huì)有數(shù)據(jù)。根據(jù)字段類型的不同占不同的字節(jié),例如boolean類型占1個(gè)字節(jié),int類型占4個(gè)字節(jié)等等;

對(duì)齊數(shù)據(jù)

對(duì)象可以有對(duì)齊數(shù)據(jù)也可以沒(méi)有。默認(rèn)情況下,Java虛擬機(jī)堆中對(duì)象的起始地址需要對(duì)齊至8的倍數(shù)。如果一個(gè)對(duì)象用不到8N個(gè)字節(jié)則需要對(duì)其填充,以此來(lái)補(bǔ)齊對(duì)象頭和實(shí)例數(shù)據(jù)占用內(nèi)存之后剩余的空間大小。如果對(duì)象頭和實(shí)例數(shù)據(jù)已經(jīng)占滿了JVM所分配的內(nèi)存空間,那么就不用再進(jìn)行對(duì)齊填充了。

所有的對(duì)象分配的字節(jié)總SIZE需要是8的倍數(shù),如果前面的對(duì)象頭和實(shí)例數(shù)據(jù)占用的總SIZE不滿足要求,則通過(guò)對(duì)齊數(shù)據(jù)來(lái)填滿。

為什么要對(duì)齊數(shù)據(jù)?字段內(nèi)存對(duì)齊的其中一個(gè)原因,是讓字段只出現(xiàn)在同一CPU的緩存行中。如果字段不是對(duì)齊的,那么就有可能出現(xiàn)跨緩存行的字段。也就是說(shuō),該字段的讀取可能需要替換兩個(gè)緩存行,而該字段的存儲(chǔ)也會(huì)同時(shí)污染兩個(gè)緩存行。這兩種情況對(duì)程序的執(zhí)行效率而言都是不利的。其實(shí)對(duì)其填充的最終目的是為了計(jì)算機(jī)高效尋址。

至此,我們已經(jīng)了解了對(duì)象在堆內(nèi)存中的整體結(jié)構(gòu)布局,如下圖所示

Talk is cheap, show me code

概念的東西是抽象的,你說(shuō)它是這樣組成的,就真的是嗎?學(xué)習(xí)是需要持懷疑的態(tài)度的,任何理論和概念只有自己證實(shí)和實(shí)踐之后才能接受它。還好 openjdk 給我們提供了一個(gè)工具包,可以用來(lái)獲取對(duì)象的信息和虛擬機(jī)的信息,我們只需引入 jol-core 依賴,如下

<dependency>
  <groupId>org.openjdk.jol</groupId>
  <artifactId>jol-core</artifactId>
  <version>0.8</version>
</dependency>

jol-core 常用的三個(gè)方法

  • ClassLayout.parseInstance(object).toPrintable():查看對(duì)象內(nèi)部信息.
  • GraphLayout.parseInstance(object).toPrintable():查看對(duì)象外部信息,包括引用的對(duì)象.
  • GraphLayout.parseInstance(object).totalSize():查看對(duì)象總大小.

普通對(duì)象

為了簡(jiǎn)單化,我們不用復(fù)雜的對(duì)象,自己創(chuàng)建一個(gè)類 D,先看無(wú)屬性字段的時(shí)候

public class D {
}

通過(guò) jol-core 的 api,我們將對(duì)象的內(nèi)部信息打印出來(lái)

public static void main(String[] args) {
    D d = new D();
    System.out.println(ClassLayout.parseInstance(d).toPrintable());
}

最后的打印結(jié)果為

可以看到有 OFFSET、SIZE、TYPE DESCRIPTION、VALUE 這幾個(gè)名詞頭,它們的含義分別是

  • OFFSET:偏移地址,單位字節(jié);
  • SIZE:占用的內(nèi)存大小,單位為字節(jié);
  • TYPE DESCRIPTION:類型描述,其中object header為對(duì)象頭;
  • VALUE:對(duì)應(yīng)內(nèi)存中當(dāng)前存儲(chǔ)的值,二進(jìn)制32位;

可以看到,d對(duì)象實(shí)例共占據(jù)16byte,對(duì)象頭(object header)占據(jù)12byte(96bit),其中 mark word占8byte(64bit),klass pointe 占4byte,另外剩余4byte是填充對(duì)齊的。

這里由于默認(rèn)開(kāi)啟了指針壓縮,所以對(duì)象頭占了12byte,具體的指針壓縮的概念這里就不再闡述了,感興趣的讀者可以自己查閱下官方文檔。jdk8版本是默認(rèn)開(kāi)啟指針壓縮的,可以通過(guò)配置vm參數(shù)開(kāi)啟關(guān)閉指針壓縮,-XX:-UseCompressedOops。

如果關(guān)閉指針壓縮重新打印對(duì)象的內(nèi)存布局,可以發(fā)現(xiàn)總SIZE變大了,從下圖中可以看到,對(duì)象頭所占用的內(nèi)存大小變?yōu)?6byte(128bit),其中 mark word占8byte,klass pointe 占8byte,無(wú)對(duì)齊填充。

開(kāi)啟指針壓縮可以減少對(duì)象的內(nèi)存使用。從兩次打印的D對(duì)象布局信息來(lái)看,關(guān)閉指針壓縮時(shí),對(duì)象頭的SIZE增加了4byte,這里由于D對(duì)象是無(wú)屬性的,讀者可以試試增加幾個(gè)屬性字段來(lái)看下,這樣會(huì)明顯的發(fā)現(xiàn)SIZE增長(zhǎng)。因此開(kāi)啟指針壓縮,理論上來(lái)講,大約能節(jié)省百分之五十的內(nèi)存。jdk8及以后版本已經(jīng)默認(rèn)開(kāi)啟指針壓縮,無(wú)需配置。

數(shù)組對(duì)象

上面使用的是普通對(duì)象,我們來(lái)看下數(shù)組對(duì)象的內(nèi)存布局,比較下有什么異同

public static void main(String[] args) {
    int[] a = {1};
    System.out.println(ClassLayout.parseInstance(a).toPrintable());
}

打印的內(nèi)存布局信息,如下

可以看到這時(shí)總SIZE為共24byte,對(duì)象頭占16byte,其中Mark Work占8byte,Klass Point 占4byte,array length 占4byte,因?yàn)槔锩嬷挥幸粋€(gè)int 類型的1,所以數(shù)組對(duì)象的實(shí)例數(shù)據(jù)占據(jù)4byte,剩余對(duì)齊填充占據(jù)4byte。

結(jié)尾

經(jīng)過(guò)以上的內(nèi)容我們了解了對(duì)象在內(nèi)存中的布局,了解對(duì)象的內(nèi)存布局和對(duì)象頭的概念,特別是對(duì)象頭的Mark Word的內(nèi)容,在我們后續(xù)分析 synchronize 鎖優(yōu)化 和 JVM 垃圾回收年齡代的時(shí)候會(huì)有很大作用。

JVM中大家是否還記得對(duì)象在Suvivor中每熬過(guò)一次MinorGC,年齡就增加1,當(dāng)它的年齡增加到一定程度后就會(huì)被晉升到老年代中,這個(gè)次數(shù)默認(rèn)是15歲,有想過(guò)為什么是15嗎?在Mark Word中可以發(fā)現(xiàn)標(biāo)記對(duì)象分代年齡的分配的空間是4bit,而4bit能表示的最大數(shù)就是2^4-1 = 15。

以上就是關(guān)于Java對(duì)象在內(nèi)存中的構(gòu)成和對(duì)象頭概念的全部?jī)?nèi)容,想要了解更多關(guān)于Java底層知識(shí)的內(nèi)容,請(qǐng)搜索W3Cschool其他相關(guān)文章。如果覺(jué)得本篇文章不錯(cuò),還希望大家多多支持!


0 人點(diǎn)贊