高效動態(tài)語言虛擬機(jī)的設(shè)計(jì)(一)
- 作者:新網(wǎng)
- 來源:新網(wǎng)
- 瀏覽:100
- 2018-05-09 14:43:06
最近在做Python相關(guān)的一些東西,發(fā)現(xiàn)Python的性能實(shí)在是非常差,所以就深入到Python內(nèi)部,看了一下它的實(shí)現(xiàn),并對比了幾個比較流行的虛擬機(jī)的實(shí)現(xiàn),包括:
最近在做Python相關(guān)的一些東西,發(fā)現(xiàn)Python的性能實(shí)在是非常差,所以就深入到Python內(nèi)部,看了一下它的實(shí)現(xiàn),并對比了幾個比較流行的虛擬機(jī)的實(shí)現(xiàn),包括:
<
div> V8 (Javascript)
Tamarin (ActionScript 3)
Lua 5.0
CPython (Python 2.7.2)
做了一定分析和比對,獲得了一些靈感,在這里寫下來作一個分享的討論。
Ok,先從計(jì)算機(jī)是如何將一個高級語言的代碼,轉(zhuǎn)變成可以執(zhí)行的程序說起。
計(jì)算機(jī)程序語言的機(jī)制
眾所周知,計(jì)算機(jī)能夠執(zhí)行的代碼是機(jī)器碼,也就是所謂的二進(jìn)制。那么一段高級語言的代碼要想能夠被計(jì)算機(jī)執(zhí)行,必須經(jīng)過這樣的一個過程:
編譯 (將源代碼編譯成目標(biāo)代碼:目標(biāo)代碼是機(jī)器碼片段的集合,每一段機(jī)器碼都有一個名字,也就是這段代碼的符號)
連接 (將多個目標(biāo)文件中的符號連接在一起,形成一個大的可執(zhí)行機(jī)器碼,這樣計(jì)算機(jī)(大部分時候是
操作系統(tǒng))就可以加載、執(zhí)行代碼了)
編譯器的設(shè)計(jì)
在早期,編譯的過程是直譯式的,編譯器直接將源代碼解析成Token流,再將Token流分析成AST(抽象語法樹),然后直接根據(jù)抽象語法樹中的語法元素生成目標(biāo)機(jī)器的匯編代碼,最后再通過匯編器(Assembler)匯編成目標(biāo)文件。
然而現(xiàn)代的編譯器都會有一種中間代碼,然后將編譯器分成兩半(前端和后端)。
前端是語言相關(guān)的,負(fù)責(zé)將原始的語言編譯成中間代碼;
后端是目標(biāo)機(jī)器相關(guān)的,負(fù)責(zé)將中間代碼翻譯成目標(biāo)機(jī)器的機(jī)器碼。
這樣做的好處就在于,編譯器變得更加可移植了。
當(dāng)出現(xiàn)一種新的語言時,只要實(shí)現(xiàn)一個這個語言的前端,就可以工作在不同的平臺和cpu上;
當(dāng)出現(xiàn)一個新的平臺時,只要實(shí)現(xiàn)一個后端,就可以支持所有的語言。
GCC就是這樣設(shè)計(jì)的一個范例。
從上一節(jié)的內(nèi)容,我們可以看出,假設(shè)語言都實(shí)現(xiàn)到了生成中間語言這一步,那么虛擬機(jī)的實(shí)現(xiàn)可以有2種方式:
Interpreting (解釋執(zhí)行)
也就是通過類似while() { switch() {} }的循環(huán),分析中間語言的每條指令,動態(tài)解釋執(zhí)行
Binary Translation (這個名詞大家可能比較陌生,它還有一個大家更加熟知的名字:JIT)
顧名思義,就是虛擬機(jī)實(shí)現(xiàn)了從中間語言,到可執(zhí)行文件的轉(zhuǎn)換的功能,在運(yùn)行時,將中間語言轉(zhuǎn)換成了可執(zhí)行文件,最終執(zhí)行
這兩種方式各有特色:
Interpreting
啟動非??焖伲瑘?zhí)行性能相對較差,通常應(yīng)用于一些對性能本身不是很敏感的語言
Binary Translation
有一個翻譯的過程,啟動的時候會相對比較慢,但是執(zhí)行的性能非常好,有時甚至比c代碼還要快速(聽起來很科幻?)
我們來橫向比較一下這幾個虛擬機(jī)的實(shí)現(xiàn)方式:
虛擬機(jī)語言語言特性虛擬機(jī)實(shí)現(xiàn)方式速度
V8JavaScript較豐富Binary Translation非???/div>
TamarinActionScript 3(EcmaScript 4)較豐富Interpreting + Binary Translation非常快
Lua 5.0Lua 5.0較少Interpreting較快
CPythonPython 2.7很豐富Interpreting較慢
從這里,我們可以看到使用Jit方式執(zhí)行的虛擬機(jī)明顯比較快,而采用解釋執(zhí)行的虛擬機(jī)明顯較慢。
然而同樣是采用解釋執(zhí)行的虛擬機(jī),lua也要比
python更快,這不僅僅是由于語言更簡單導(dǎo)致的,同時也跟lua虛擬機(jī)的實(shí)現(xiàn)有關(guān)。
V8是一朵奇葩
V8虛擬機(jī)可以說是所有的虛擬機(jī)里面設(shè)計(jì)最特別的一款,所有其他的虛擬機(jī)都會首先將源代碼編譯成一種中間代碼,如:
虛擬機(jī)中間代碼指令數(shù)
Tamarinabc (Adobe Byte Code)200+
LuaLua Byte Code35
PythonPython Byte Code100+
然而,v8虛擬機(jī)的方式很特別,它在進(jìn)行jit的時候直接從ast生成目標(biāo)平臺的匯編代碼,并使用內(nèi)置的宏匯編器生成可執(zhí)行代碼,這樣就大大減少了jit過程所消耗的時間。
Lua的指令為什么那么少?
細(xì)心的讀者一定發(fā)現(xiàn)了,Lua虛擬機(jī)的指令要比其他的虛擬機(jī)少很多,甚至不再同一個數(shù)量級上,那為什么那么設(shè)計(jì)呢? 最近在做Python相關(guān)的一些東西,發(fā)現(xiàn)Python的性能實(shí)在是非常差,所以就深入到Python內(nèi)部,看了一下它的實(shí)現(xiàn),并對比了幾個比較流行的虛擬機(jī)的實(shí)現(xiàn),包括:
V8 (Javascript)
Tamarin (ActionScript 3)
Lua 5.0
CPython (Python 2.7.2)
做了一定分析和比對,獲得了一些靈感,在這里寫下來作一個分享的討論。
Ok,先從計(jì)算機(jī)是如何將一個高級語言的代碼,轉(zhuǎn)變成可以執(zhí)行的程序說起。
計(jì)算機(jī)程序語言的機(jī)制
眾所周知,計(jì)算機(jī)能夠執(zhí)行的代碼是機(jī)器碼,也就是所謂的二進(jìn)制。那么一段高級語言的代碼要想能夠被計(jì)算機(jī)執(zhí)行,必須經(jīng)過這樣的一個過程:
編譯 (將源代碼編譯成目標(biāo)代碼:目標(biāo)代碼是機(jī)器碼片段的集合,每一段機(jī)器碼都有一個名字,也就是這段代碼的符號)
連接 (將多個目標(biāo)文件中的符號連接在一起,形成一個大的可執(zhí)行機(jī)器碼,這樣計(jì)算機(jī)(大部分時候是操作系統(tǒng))就可以加載、執(zhí)行代碼了)
編譯器的設(shè)計(jì)
在早期,編譯的過程是直譯式的,編譯器直接將源代碼解析成Token流,再將Token流分析成AST(抽象語法樹),然后直接根據(jù)抽象語法樹中的語法元素生成目標(biāo)機(jī)器的匯編代碼,最后再通過匯編器(Assembler)匯編成目標(biāo)文件。
然而現(xiàn)代的編譯器都會有一種中間代碼,然后將編譯器分成兩半(前端和后端)。
前端是語言相關(guān)的,負(fù)責(zé)將原始的語言編譯成中間代碼;
后端是目標(biāo)機(jī)器相關(guān)的,負(fù)責(zé)將中間代碼翻譯成目標(biāo)機(jī)器的機(jī)器碼。
這樣做的好處就在于,編譯器變得更加可移植了。
當(dāng)出現(xiàn)一種新的語言時,只要實(shí)現(xiàn)一個這個語言的前端,就可以工作在不同的平臺和cpu上;
當(dāng)出現(xiàn)一個新的平臺時,只要實(shí)現(xiàn)一個后端,就可以支持所有的語言。
GCC就是這樣設(shè)計(jì)的一個范例。
從上一節(jié)的內(nèi)容,我們可以看出,假設(shè)語言都實(shí)現(xiàn)到了生成中間語言這一步,那么虛擬機(jī)的實(shí)現(xiàn)可以有2種方式:
Interpreting (解釋執(zhí)行)
也就是通過類似while() { switch() {} }的循環(huán),分析中間語言的每條指令,動態(tài)解釋執(zhí)行
Binary Translation (這個名詞大家可能比較陌生,它還有一個大家更加熟知的名字:JIT)
顧名思義,就是虛擬機(jī)實(shí)現(xiàn)了從中間語言,到可執(zhí)行文件的轉(zhuǎn)換的功能,在運(yùn)行時,將中間語言轉(zhuǎn)換成了可執(zhí)行文件,最終執(zhí)行
這兩種方式各有特色:
Interpreting
啟動非??焖伲瑘?zhí)行性能相對較差,通常應(yīng)用于一些對性能本身不是很敏感的語言
Binary Translation
有一個翻譯的過程,啟動的時候會相對比較慢,但是執(zhí)行的性能非常好,有時甚至比c代碼還要快速(聽起來很科幻?)
我們來橫向比較一下這幾個虛擬機(jī)的實(shí)現(xiàn)方式:
虛擬機(jī)語言語言特性虛擬機(jī)實(shí)現(xiàn)方式速度
V8JavaScript較豐富Binary Translation非???/div>
TamarinActionScript 3(EcmaScript 4)較豐富Interpreting + Binary Translation非???/div>
Lua 5.0Lua 5.0較少Interpreting較快
CPythonPython 2.7很豐富Interpreting較慢
從這里,我們可以看到使用Jit方式執(zhí)行的虛擬機(jī)明顯比較快,而采用解釋執(zhí)行的虛擬機(jī)明顯較慢。
然而同樣是采用解釋執(zhí)行的虛擬機(jī),lua也要比python更快,這不僅僅是由于語言更簡單導(dǎo)致的,同時也跟lua虛擬機(jī)的實(shí)現(xiàn)有關(guān)。
V8是一朵奇葩
V8虛擬機(jī)可以說是所有的虛擬機(jī)里面設(shè)計(jì)最特別的一款,所有其他的虛擬機(jī)都會首先將源代碼編譯成一種中間代碼,如:
虛擬機(jī)中間代碼指令數(shù)
Tamarinabc (Adobe Byte Code)200+
LuaLua Byte Code35
PythonPython Byte Code100+
然而,v8虛擬機(jī)的方式很特別,它在進(jìn)行jit的時候直接從ast生成目標(biāo)平臺的匯編代碼,并使用內(nèi)置的宏匯編器生成可執(zhí)行代碼,這樣就大大減少了jit過程所消耗的時間。
Lua的指令為什么那么少?
細(xì)心的讀者一定發(fā)現(xiàn)了,Lua虛擬機(jī)的指令要比其他的虛擬機(jī)少很多,甚至不再同一個數(shù)量級上,那為什么那么設(shè)計(jì)呢?
免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請發(fā)送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。