JVM系列二(虛擬機對象創(chuàng)建、布局、定位)
- 作者:新網(wǎng)
- 來源:新網(wǎng)
- 瀏覽:100
- 2018-05-04 15:20:19
Java是一門面向對象的編程語言,在Java程序運行過程中無時無刻都有對象被創(chuàng)建出來。在語言層面上,創(chuàng)建對象(如克隆、反序列化)通常僅僅是一個new關鍵字而已,而在虛擬機中,對象(文中討論的對象限于普通Java對象,不包括數(shù)組和Class對象等)的創(chuàng)建又是怎么樣一個過程呢?
<
div> Java是一門面向對象的編程語言,在Java程序運行過程中無時無刻都有對象被創(chuàng)建出來。在語言層面上,創(chuàng)建對象(如克隆、反序列化)通常僅僅是一個new關鍵字而已,而在
虛擬機中,對象(文中討論的對象限于普通Java對象,不包括數(shù)組和Class對象等)的創(chuàng)建又是怎么樣一個過程呢?
虛擬機遇到一條new指令時,首先將去檢查這個指令的參數(shù)是否能在常量池中定位到一個類的符號引用,并且檢查這個符號引用代表的類是否已被加載、解析和初始化過。如果沒有,那必須西安執(zhí)行響應的類加載過程。
在類加載檢查通過后,接下來虛擬機將為新生對象分配內(nèi)存。對象所需內(nèi)存的大小在類加載完成之后便可以完全確定(怎么確定),為對象分配
空間的任務等同于把一塊確定大小的內(nèi)存從Java堆中劃分出來。假設Java堆中內(nèi)存是絕對規(guī)整的,所有用過的內(nèi)存都放在一邊,空閑的內(nèi)存放在另一邊,中間放著一個指針作為分界點的指示器,那所分配內(nèi)存就僅僅是把那個指針向空閑空間那邊挪動一段與對象大小相等的距離,這種分配方式稱為“指針碰撞”(Bump the Pointer)。如果Java堆中的內(nèi)存并不是規(guī)整的,已使用的內(nèi)存和空閑的內(nèi)存互相交錯,那就沒有辦法簡單地進行指針碰撞了,虛擬機就必須維護一個列表,記錄上那些內(nèi)存塊是可用的,在分配的時候從列表中找出一塊足夠大的空間劃分給對象實例,并更新列表上的記錄,這種分配方式稱為“空閑列表”(Free List)。選擇哪種分配方式由Java堆是否規(guī)整決定,而Java堆是否規(guī)整又由所采用的垃圾收集器是否帶有壓縮整理功能決定。因此,在使用Serial、ParNew等帶Compact過程的收集器時,系統(tǒng)采用的分配算法是指針碰撞,而使用CMS這種基于Mark-Sweep算法的收集器時,通常采用空閑列表。
除如何劃分可用空間之外,還有另外一個需要考慮的問題是對象創(chuàng)建在虛擬機中是非常頻繁的行為,即使是僅僅修改一個指針所指向的位置,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對象A分配內(nèi)存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內(nèi)存的情況。解決這個問題有兩種方案,一種是對分配內(nèi)存空間的動作進行同步處理——實際上虛擬機采用CAS配上失敗重試的方式保證更新操作的原子性;另一種是把內(nèi)存分配的動作按照線程劃分在不同的空間之中進行,即每個線程在Java堆中預先分配一小塊內(nèi)存,稱為本地線程分配緩沖(Thread Local Allocation Buffer, TLAB)。哪個線程要分配內(nèi)存,就在哪個線程的TLAB上分配,只有TLAB用完并分配新的TLAB時,才需要同步鎖定。虛擬機是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來設定。
內(nèi)存分配完成之后,虛擬機需要將分配到的內(nèi)存空間都初始化為零值,如果使用TLAB,這一工作過程也可以提前至TLAB分配時進行。這一步操作保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對應的零值。
接下來,虛擬機要對對象進行必要的設置,例如這個對象是那個類的實例、如何才能找到類的元數(shù)據(jù)信息、對象的哈希碼、對象的GC分帶年齡等信息。這些信息存放在對象的對象頭(Object Header)之中。根據(jù)虛擬機當前的運行狀態(tài)的不同,如是否啟用偏向鎖等,對象頭會有不同的設置方式。
在上面的工作都完成之后,從虛擬機的角度來看,一個新的對象已經(jīng)產(chǎn)生了,但從Java程序的視角來看,對象創(chuàng)建才剛剛開始,方法還沒有執(zhí)行,所有的字段都還為零。所以,一般來說(由字節(jié)碼中是否跟隨invokespecial指令所決定),執(zhí)行New指令之后會接著執(zhí)行方法,把對象按照程序員的意愿進行初始化,這樣一個真正的對象才算完全生產(chǎn)出來。
對象的內(nèi)存布局
在HotSpot虛擬機中,對象在內(nèi)存中的布局可以分為三塊區(qū)域
1 對象頭(Header),包括兩部分信息
?、俚谝徊糠钟糜诖鎯ο笞陨磉\行時數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標志、線程持有的鎖、偏向線程ID、偏向時間戳等,這部分數(shù)據(jù)的長度在32位和64位的虛擬機中分別為32bit和64bit,官方稱它為“Mark Word”。對象需要存儲的運行時數(shù)據(jù)很多,其實已經(jīng)超出32位、64位Bitmap結構所能記錄的限度但是對象頭信息是與對象自身定義的數(shù)據(jù)無關的額外存儲成本,考慮到虛擬機的空間效率,Mark Word 被設計成一個非固定的數(shù)據(jù)結構以便在極小的空間內(nèi)存儲盡量多的信息,它會根據(jù)對象的狀態(tài)服用自己的存儲空間。例如,在32位的HotSpot虛擬機中,如果對象處于未被鎖定的狀態(tài)下,那么MarkWord的32位bit空間中的25bit用于存儲對象哈希碼,4bit用于存儲對象分代年齡,2bit用于存儲鎖標志位,1bit固定為0。
?、?對象頭的另外一部分是類型指針,即對象指向它的類元數(shù)據(jù)的指針,虛擬機通過這個指針來確定這個對象是那個類的實例。并不是所有的虛擬機實現(xiàn)都必須在對象數(shù)據(jù)上保留類型指針,換句話說,查找對象的元數(shù)據(jù)信息并不一定經(jīng)過對象本身,另外,如果對象是一個Java數(shù)組,那在對象頭中還必須有一塊用于記錄數(shù)組長度的數(shù)據(jù),因為虛擬機可以通過普通Java對象的元數(shù)據(jù)信息確定Java對象的大小,但是從數(shù)組的元數(shù)據(jù)中卻無法確定數(shù)組的大小。
2 實例數(shù)據(jù)(Insatance Data)
實例數(shù)據(jù)部分是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段內(nèi)容。無論是從父類繼承下來的,還是在子類中定義的,都需要記錄起來,這部分的存儲順序會收到虛擬機分配策略參數(shù)(FiledsAllocationStyle)和字段在Java源碼中定義順序的影響。HotSpot虛擬機默認的分配策略為long/doubles、ints、shorts/chars、bytes/boolean、oops(Ordinary Object Pointers),從分配策略中可以看出。相同寬度的字段總是被分配到一起,在滿足這個前提條件的情況下,在父類中定義的變量會出現(xiàn)在子類之前。如果CompactFields參數(shù)值為true(默認為true),那么子類之中較窄的變量可能會插入到父類變量的空隙之中。
3 對其填充(Pandding)
對其填充并不是必然存在的也沒有什么特別的含義,他僅僅起著占位符的作用。由于HotSpot VM的自動內(nèi)存管理系統(tǒng)要求對象起始地址必須是8字節(jié)的整數(shù)倍,換句換說,就是對象的大小必須是8字節(jié)的整數(shù)倍。而對象頭部分正好是8字節(jié)的倍數(shù)(1倍或者2倍),因此,對象實例數(shù)據(jù)部分沒有對齊時,就需要通過對其填充來補全。
對象的訪問定位
建立對象是為了使用對象,Java程序需要通過棧上的reference數(shù)據(jù)來操作堆上的具體對象。由于reference類型在Java虛擬機規(guī)范中只規(guī)定了一個指向對象的引用,并沒有定義這個引用應該通過何種方式去定位、訪問堆中的對象的具體位置,所以對象訪問方式也是取決于虛擬機實現(xiàn)而定的。目前主流的訪問方式有使用句柄和直接指針兩種。
1 如果使用句柄訪問的話,那么Java堆中將會劃分出一塊內(nèi)存來作為句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數(shù)據(jù)與類型數(shù)據(jù)各自的具體地址信息
2 指針訪問 那么Java堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關信息,而reference中存儲的直接就是對象地址
這兩種對象訪問方式各有優(yōu)勢,使用句柄來訪問的最大好處就是reference中存儲的是穩(wěn)定的句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只會改變句柄中的實例數(shù)據(jù)指針,而reference本身不需要修改。
使用直接指針訪問方式的最大好處就是速度更快,它節(jié)省了一次指針定位的時間開銷,由于對象的訪問在Java中非常頻繁,因此這類開銷積少成多后也是一項非??捎^的執(zhí)行成本。HotSpot使用的是直接指針這種方式訪問對象的。