我們知道作為一個(gè)Java程序員,每天都在寫(xiě)Java代碼,寫(xiě)的代碼都是在一個(gè)叫做Java虛擬機(jī)的東西上執(zhí)行的。但是如果要問(wèn)什么是虛擬機(jī),恐怕很多人就會(huì)模棱兩可了。在本文中,小編會(huì)寫(xiě)下我對(duì)虛擬機(jī)的理解。
我們知道作為一個(gè)Java程序員,每天都在寫(xiě)Java代碼,寫(xiě)的代碼都是在一個(gè)叫做Java
虛擬機(jī)的東西上執(zhí)行的。但是如果要問(wèn)什么是虛擬機(jī),恐怕很多人就會(huì)模棱兩可了。在本文中,小編會(huì)寫(xiě)下我對(duì)虛擬機(jī)的理解。
我們都知道
java程序必須在虛擬機(jī)上運(yùn)行。那么虛擬機(jī)到底是什么呢?先看網(wǎng)上搜索到的比較靠譜的解釋:
虛擬機(jī)是一種抽象化的計(jì)算機(jī),通過(guò)在實(shí)際的計(jì)算機(jī)上仿真模擬各種計(jì)算機(jī)功能來(lái)實(shí)現(xiàn)的。Java虛擬機(jī)有自己完善的硬體架構(gòu),如處理器、堆棧、寄存器等,還具有相應(yīng)的指令系統(tǒng)。JVM屏蔽了與具體
操作系統(tǒng)平臺(tái)相關(guān)的信息,使得Java程序只需生成在Java虛擬機(jī)上運(yùn)行的目標(biāo)代碼(字節(jié)碼),就可以在多種平臺(tái)上不加修改地運(yùn)行。
這種解釋?xiě)?yīng)該算是正確的,但是只描述了虛擬機(jī)的外部行為和功能,并沒(méi)有針對(duì)內(nèi)部原理做出說(shuō)明。一般情況下我們不需要知道虛擬機(jī)的運(yùn)行原理,只要專注寫(xiě)java代碼就可以了,這也正是虛擬機(jī)之所以存在的原因--屏蔽底層操作系統(tǒng)平臺(tái)的不同并且減少基于原生語(yǔ)言開(kāi)發(fā)的復(fù)雜性,使java這門語(yǔ)言能夠跨各種平臺(tái)(只要虛擬機(jī)廠商在特定平臺(tái)上實(shí)現(xiàn)了虛擬機(jī)),并且簡(jiǎn)單易用。這些都是虛擬機(jī)的外部特性,但是從這些信息來(lái)解釋虛擬機(jī),未免太籠統(tǒng)了,無(wú)法讓我們知道內(nèi)部原理。
從進(jìn)程的角度解釋JVM
讓我們嘗試從操作系統(tǒng)的層面來(lái)理解虛擬機(jī)。我們知道,虛擬機(jī)是運(yùn)行在操作系統(tǒng)之中的,那么什么東西才能在操作系統(tǒng)中運(yùn)行呢?當(dāng)然是進(jìn)程,因?yàn)檫M(jìn)程是操作系統(tǒng)中的執(zhí)行單位??梢赃@樣理解,當(dāng)它在運(yùn)行的時(shí)候,它就是一個(gè)操作系統(tǒng)中的進(jìn)程實(shí)例,當(dāng)它沒(méi)有在運(yùn)行時(shí)(作為可執(zhí)行文件存放于文件系統(tǒng)中),可以把它叫做程序。
對(duì)命令行比較熟悉的同學(xué),都知道其實(shí)一個(gè)命令對(duì)應(yīng)一個(gè)可執(zhí)行的二進(jìn)制文件,當(dāng)敲下這個(gè)命令并且回車后,就會(huì)創(chuàng)建一個(gè)進(jìn)程,加載對(duì)應(yīng)的可執(zhí)行文件到進(jìn)程的地址
空間中,并且執(zhí)行其中的指令。下面對(duì)比C語(yǔ)言和Java語(yǔ)言的HelloWorld程序來(lái)說(shuō)明問(wèn)題。
首先編寫(xiě)C語(yǔ)言版的HelloWorld程序。
#include
#include
int main(void) {
printf("hello world\\n");
return 0;
}
編譯C語(yǔ)言版的HelloWorld程序:
gcc HelloWorld.c -o HelloWorld
運(yùn)行C語(yǔ)言版的HelloWorld程序:
zhangjg@
linux:/deve/workspace/HelloWorld/src$ ./HelloWorld
hello world
gcc編譯器編譯后的文件直接就是可被操作系統(tǒng)識(shí)別的二進(jìn)制可執(zhí)行文件,當(dāng)我們?cè)诿钚兄星孟?./HelloWorld這條命令的時(shí)候, 直接創(chuàng)建一個(gè)進(jìn)程, 并且將可執(zhí)行文件加載到進(jìn)程的地址空間中, 執(zhí)行文件中的指令。
作為對(duì)比, 我們看一下Java版HelloWord程序的編譯和執(zhí)行形式。
首先編寫(xiě)源文件HelloWord.java :
public class HelloWorld {
public static void main(String[] args) {
System.out.println("HelloWorld");
}
}
編譯Java版的HelloWorld程序:
zhangjg@linux:/deve/workspace/HelloJava/src$ javac HelloWorld.java
zhangjg@linux:/deve/workspace/HelloJava/src$ ls
HelloWorld.class HelloWorld.java
運(yùn)行Java版的HelloWorld程序:
zhangjg@linux:/deve/workspace/HelloJava/src$ java -classpath . HelloWorld
HelloWorld
從上面的過(guò)程可以看到, 我們?cè)谶\(yùn)行Java版的HelloWorld程序的時(shí)候, 敲入的命令并不是 ./HelloWorld.class 。 因?yàn)閏lass文件并不是可以直接被操作系統(tǒng)識(shí)別的二進(jìn)制可執(zhí)行文件 。 我們敲入的是java這個(gè)命令。 這個(gè)命令說(shuō)明, 我們首先啟動(dòng)的是一個(gè)叫做java的程序, 這個(gè)java程序在運(yùn)行起來(lái)之后就是一個(gè)JVM進(jìn)程實(shí)例。
上面的命令執(zhí)行流程是這樣的:
java命令首先啟動(dòng)虛擬機(jī)進(jìn)程,虛擬機(jī)進(jìn)程成功啟動(dòng)后,讀取參數(shù)"HelloWorld",把他作為初始類加載到內(nèi)存,對(duì)這個(gè)類進(jìn)行初始化和動(dòng)態(tài)鏈接(關(guān)于類的初始化和動(dòng)態(tài)鏈接會(huì)在后面的博客中介紹),然后從這個(gè)類的main方法開(kāi)始執(zhí)行。也就是說(shuō)我們的.class文件不是直接被系統(tǒng)加載后直接在cpu上執(zhí)行的,而是被一個(gè)叫做虛擬機(jī)的進(jìn)程托管的。首先必須虛擬機(jī)進(jìn)程啟動(dòng)就緒,然后由虛擬機(jī)中的類加載器加載必要的class文件,包括jdk中的基礎(chǔ)類(如String和Object等),然后由虛擬機(jī)進(jìn)程解釋class字節(jié)碼指令,把這些字節(jié)碼指令翻譯成本機(jī)cpu能夠識(shí)別的指令,才能在cpu上運(yùn)行。
從這個(gè)層面上來(lái)看,在執(zhí)行一個(gè)所謂的java程序的時(shí)候,真真正正在執(zhí)行的是一個(gè)叫做Java虛擬機(jī)的進(jìn)程,而不是我們寫(xiě)的一個(gè)個(gè)的class文件。這個(gè)叫做虛擬機(jī)的進(jìn)程處理一些底層的操作,比如內(nèi)存的分配和釋放等等。我們編寫(xiě)的class文件只是虛擬機(jī)進(jìn)程執(zhí)行時(shí)需要的"原料"。這些"原料"在運(yùn)行時(shí)被加載到虛擬機(jī)中,被虛擬機(jī)解釋執(zhí)行,以控制虛擬機(jī)實(shí)現(xiàn)我們java代碼中所定義的一些相對(duì)高層的操作,比如創(chuàng)建一個(gè)文件等,可以將class文件中的信息看做對(duì)虛擬機(jī)的控制信息,也就是一種虛擬指令。
編程語(yǔ)言也有自己的原理, 學(xué)習(xí)一門語(yǔ)言, 主要是把它的原理搞明白。 看似一個(gè)簡(jiǎn)單的HelloWorld程序, 也有很多深入的內(nèi)容值得剖析。
JVM體系結(jié)構(gòu)簡(jiǎn)介
為了展示虛擬機(jī)進(jìn)程和class文件的關(guān)系,特意畫(huà)了下面一張圖:
根據(jù)上圖表達(dá)的內(nèi)容,我們編譯之后的class文件是作為Java虛擬機(jī)的原料被輸入到Java虛擬機(jī)的內(nèi)部的,那么具體由誰(shuí)來(lái)做這一部分工作呢?其實(shí)在Java虛擬機(jī)內(nèi)部,有一個(gè)叫做類加載器的子系統(tǒng),這個(gè)子系統(tǒng)用來(lái)在運(yùn)行時(shí)根據(jù)需要加載類。注意上面一句話中的"根據(jù)需要"四個(gè)字。在Java虛擬機(jī)執(zhí)行過(guò)程中,只有他需要一個(gè)類的時(shí)候,才會(huì)調(diào)用類加載器來(lái)加載這個(gè)類,并不會(huì)在開(kāi)始運(yùn)行時(shí)加載所有的類。就像一個(gè)人,只有餓的時(shí)候才去吃飯,而不是一次把一年的飯都吃到肚子里。一般來(lái)說(shuō),虛擬機(jī)加載類的時(shí)機(jī),在第一次使用一個(gè)新的類的時(shí)候。本專欄后面的文章會(huì)具體討論Java中的類加載器。
由虛擬機(jī)加載的類,被加載到Java虛擬機(jī)內(nèi)存中之后,虛擬機(jī)會(huì)讀取并執(zhí)行它里面存在的字節(jié)碼指令。虛擬機(jī)中執(zhí)行字節(jié)碼指令的部分叫做執(zhí)行引擎。就像一個(gè)人,不是把飯吃下去就完事了,還要進(jìn)行消化,執(zhí)行引擎就相當(dāng)于人的腸胃系統(tǒng)。在執(zhí)行的過(guò)程中還會(huì)把各個(gè)class文件動(dòng)態(tài)的連接起來(lái)。關(guān)于執(zhí)行引擎的具體行為和動(dòng)態(tài)鏈接相關(guān)的內(nèi)容也會(huì)在本專欄后續(xù)的文章中進(jìn)行討論。
我們知道,Java虛擬機(jī)會(huì)進(jìn)行自動(dòng)內(nèi)存管理。具體說(shuō)來(lái)就是自動(dòng)釋放沒(méi)有用的對(duì)象,而不需要程序員編寫(xiě)代碼來(lái)釋放分配的內(nèi)存。這部分工作由垃圾收集子系統(tǒng)負(fù)責(zé)。
從上面的論述可以知道, 一個(gè)Java虛擬機(jī)實(shí)例在運(yùn)行過(guò)程中有三個(gè)子系統(tǒng)來(lái)保障它的正常運(yùn)行,分別是類加載器子系統(tǒng), 執(zhí)行引擎子系統(tǒng)和垃圾收集子系統(tǒng)。 如下圖所示:
虛擬機(jī)的運(yùn)行,必須加載class文件,并且執(zhí)行class文件中的字節(jié)碼指令。它做這么多事情,必須需要自己的空間。就像人吃下去的東西首先要放在胃中。虛擬機(jī)也需要空間來(lái)存放個(gè)中數(shù)據(jù)。首先,加載的字節(jié)碼,需要一個(gè)單獨(dú)的內(nèi)存空間來(lái)存放;一個(gè)線程的執(zhí)行,也需要內(nèi)存空間來(lái)維護(hù)方法的調(diào)用關(guān)系,存放方法中的數(shù)據(jù)和中間計(jì)算結(jié)果;在執(zhí)行的過(guò)程中,無(wú)法避免的要?jiǎng)?chuàng)建對(duì)象,創(chuàng)建的對(duì)象需要一個(gè)專門的內(nèi)存空間來(lái)存放。關(guān)于虛擬機(jī)運(yùn)行時(shí)數(shù)據(jù)區(qū)的內(nèi)容,也會(huì)出現(xiàn)在本專欄后續(xù)的文章中。虛擬機(jī)的運(yùn)行時(shí)內(nèi)存區(qū)大概可以分成下圖所示的幾個(gè)部分。
小編今天就說(shuō)到這里。