服務(wù)器大批量交付速度太慢?提升8倍夠不夠,在國(guó)內(nèi),BAT的年服務(wù)器需求量都接近20萬(wàn)臺(tái),并且每年都以較高的比例進(jìn)行增長(zhǎng),以20萬(wàn)臺(tái)每年的需求量來(lái)算,按照標(biāo)準(zhǔn)服務(wù)器每天550臺(tái)的平均交付速度,那么至少364天來(lái)進(jìn)行交付,也就是說(shuō),如果采用標(biāo)準(zhǔn)服務(wù)器進(jìn)行交付,那么意味著全年都要在機(jī)房進(jìn)行交付!
目前,業(yè)界主流的標(biāo)準(zhǔn)機(jī)架式服務(wù)器單日單機(jī)房交付速度在1000臺(tái)左以下,并且在大型數(shù)據(jù)中心的交付過(guò)程中,由于需要考慮數(shù)據(jù)中心整體可靠性和便于管理,往往需要更多的測(cè)試和部署時(shí)間,一般來(lái)說(shuō)單日500-600臺(tái)的交付速度已經(jīng)是平均速度。
在國(guó)內(nèi),BAT的年服務(wù)器需求量都接近20萬(wàn)臺(tái),并且每年都以較高的比例進(jìn)行增長(zhǎng),以20萬(wàn)臺(tái)每年的需求量來(lái)算,按照標(biāo)準(zhǔn)服務(wù)器每天550臺(tái)的平均交付速度,那么至少364天來(lái)進(jìn)行交付,也就是說(shuō),如果采用標(biāo)準(zhǔn)服務(wù)器進(jìn)行交付,那么意味著全年都要在機(jī)房進(jìn)行交付!
面對(duì)日益增長(zhǎng)的服務(wù)器需求,服務(wù)器的交付速度已經(jīng)不能適應(yīng)業(yè)務(wù)應(yīng)用的高速發(fā)展。如何提升大批量服務(wù)器的交付速度?目前來(lái)看最好的形式就是提升交付顆粒度,將原有以服務(wù)器作為交付最小顆粒度,提升為以整機(jī)柜甚至模塊化數(shù)據(jù)中心。浪潮聯(lián)合百度實(shí)現(xiàn)單日單機(jī)房5000節(jié)點(diǎn)的SmartRack交付就是最典型的案例之一,那么讓我們看看究竟是如何將大批量服務(wù)器交付從單日500提升至5000節(jié)點(diǎn)的。
交付是一項(xiàng)系統(tǒng)工程
先簡(jiǎn)單介紹下一般的服務(wù)器交付流程(詳見下圖)。在服務(wù)器生產(chǎn)完成后,通過(guò)物流運(yùn)輸?shù)娇蛻魯?shù)據(jù)中心所在地,由售后服務(wù)人員在現(xiàn)場(chǎng)進(jìn)行包裝拆除,并通過(guò)小型拉車運(yùn)輸?shù)綌?shù)據(jù)中心內(nèi)。再通過(guò)簡(jiǎn)單的上電測(cè)試無(wú)問(wèn)題后,工程師將服務(wù)器上架到數(shù)據(jù)中心內(nèi)的機(jī)架上,連通電源、網(wǎng)絡(luò),并將各種線纜按照客戶要求進(jìn)行整理。最后會(huì)將服務(wù)器上電,通過(guò)測(cè)試腳本進(jìn)行交付完成前最后的系統(tǒng)性測(cè)試。
接下來(lái)我們將交付各流程拆解,剖析下SmartRack為何能夠8倍于標(biāo)準(zhǔn)服務(wù)器的交付速度。
我們不是服務(wù)器的搬運(yùn)工!
標(biāo)準(zhǔn)機(jī)架服務(wù)器(1U、2U、4U或者更高)交付前是獨(dú)立包裝的,為的是保護(hù)服務(wù)器免受運(yùn)輸顛簸和沖擊威脅,但是這也造成現(xiàn)場(chǎng)拆箱將會(huì)花費(fèi)更多時(shí)間。并且在服務(wù)器從數(shù)據(jù)中心外部運(yùn)輸?shù)絻?nèi)部,需要用到小車,每臺(tái)小車承重有限,且服務(wù)器最高堆疊8臺(tái),運(yùn)輸效率大打折扣。在后續(xù)的工作,包括上架、接線和測(cè)試環(huán)節(jié),都需要逐臺(tái)進(jìn)行。
而SmartRack是以整機(jī)柜作為最小交付顆粒度,每臺(tái)SmartRack的節(jié)點(diǎn)是安裝在機(jī)柜內(nèi)統(tǒng)一出貨的,也就是在交付現(xiàn)場(chǎng),售后服務(wù)工程師可以將一臺(tái)SmartRack作為一臺(tái)服務(wù)器來(lái)看待,但是其中卻包含了至少32個(gè)節(jié)點(diǎn)。并且自帶滾輪的SmartRack可以直接推送至機(jī)架位,運(yùn)輸密度遠(yuǎn)大于標(biāo)準(zhǔn)服務(wù)器的6-8臺(tái)。
理線難!剪不斷,理還亂
在整個(gè)交付過(guò)程中,理線是最費(fèi)時(shí)間的工序之一,每臺(tái)服務(wù)器的電源線和網(wǎng)線都要和數(shù)據(jù)中心預(yù)設(shè)線路匹配,然而確保連接正確只是第一個(gè)步驟和最簡(jiǎn)單的要求。由于數(shù)據(jù)中心的服務(wù)器數(shù)量極多,相應(yīng)的電源線和網(wǎng)線也縱橫交錯(cuò),如果每臺(tái)服務(wù)器的線纜沒(méi)有進(jìn)行整理,就會(huì)增大后續(xù)運(yùn)維的難度。因此,交付人員會(huì)將每個(gè)機(jī)架所有的線纜進(jìn)行綁定,并按照既定的線路進(jìn)行固定,工序繁瑣卻需要極為細(xì)致,平均每機(jī)柜的理線就需要1.5小時(shí)左右。
而在這一環(huán)節(jié),SmartRack的優(yōu)勢(shì)更為明顯。在出廠前,浪潮就會(huì)在工廠內(nèi)將SmartRack節(jié)點(diǎn)間互聯(lián)的線纜部署整理完畢,在客戶機(jī)房上架部署時(shí)僅需要將線纜與數(shù)據(jù)中心的交換機(jī)相連。并且,SmartRack采用集中供電,每個(gè)節(jié)點(diǎn)通過(guò)內(nèi)部銅排取電,因此滿柜僅有兩條冗余電源線,與之對(duì)比,標(biāo)準(zhǔn)服務(wù)器則需要32條。
上電測(cè)試,能不能批量操作?
一般情況下,為了保障數(shù)據(jù)中心的穩(wěn)定性和交付的效率,需要兩道測(cè)試流程。第一次測(cè)試是在數(shù)據(jù)中心外,主要是驗(yàn)證服務(wù)器是否有短路或者不能開機(jī)現(xiàn)象,防止部署完成后引起整個(gè)數(shù)據(jù)中心的電力故障。標(biāo)準(zhǔn)服務(wù)器需要逐臺(tái)進(jìn)行測(cè)試,而SmartRack滿柜僅需要加電一次。另外,在冬天或者天氣較冷的季節(jié),為防止凝露,服務(wù)器需要靜置半小時(shí)以上,這將會(huì)大大影響交付速度。
第二道測(cè)試是在上架完成后,主要是測(cè)試服務(wù)器系統(tǒng)、軟件以及固件等信息是否正常。傳統(tǒng)服務(wù)器間的互聯(lián)管理采用網(wǎng)絡(luò)設(shè)備進(jìn)行連接,擴(kuò)展性受到網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)性能的限制,并且網(wǎng)絡(luò)協(xié)議復(fù)雜,層次眾多,使得集群模式下的傳統(tǒng)服務(wù)器管理受到嚴(yán)重限制。而SmartRack突破了傳統(tǒng)服務(wù)器的運(yùn)維管理架構(gòu)方案,以整機(jī)柜作為整體管理解決方案,通過(guò)RMC(Rack Management Controller)集中管理單元實(shí)現(xiàn)整個(gè)系統(tǒng)資源的實(shí)施監(jiān)控,RMC是SmartRack的信息查詢和狀態(tài)監(jiān)控的平臺(tái),具有節(jié)點(diǎn)資產(chǎn)定位,功耗監(jiān)控,散熱調(diào)控三大基本功能。
與相同數(shù)量的通用服務(wù)器相比,SmartRack到貨檢驗(yàn)時(shí)間由原來(lái)的1~2小時(shí),減少到5分鐘內(nèi)完成。并且后期,通過(guò)RMC設(shè)置管理策略,自動(dòng)監(jiān)控各模塊運(yùn)行狀態(tài)。節(jié)點(diǎn)單元、網(wǎng)絡(luò)單元、供電單元全部前端維護(hù),散熱單元后維護(hù),能夠極大方便運(yùn)維。
數(shù)據(jù)說(shuō)話,交付時(shí)間到底省在哪?
我們通過(guò)兩組交付數(shù)據(jù)來(lái)看下,標(biāo)準(zhǔn)服務(wù)器的與SmartRack的差距到底在哪。以上數(shù)據(jù)是以交付5000臺(tái)/節(jié)點(diǎn)服務(wù)器為目標(biāo),20人交付團(tuán)隊(duì)在同一交付地點(diǎn)下的數(shù)據(jù)。
通過(guò)這組數(shù)據(jù),我們可以直觀的看到SmartRack通過(guò)在拆包裝、搬運(yùn)、上架、監(jiān)測(cè)四個(gè)環(huán)節(jié)的出色表現(xiàn),交付5000節(jié)點(diǎn)僅需7.6個(gè)小時(shí)。
因此,在相同機(jī)房環(huán)境、交付規(guī)模的前提下,SmartRack交付速度能達(dá)到標(biāo)準(zhǔn)服務(wù)器的7.6倍。而從單日交付量來(lái)看,標(biāo)準(zhǔn)服務(wù)器不足1000臺(tái),而整機(jī)柜將超過(guò)5000臺(tái)!
整機(jī)柜,未來(lái)海量數(shù)據(jù)中心的主流交付形態(tài)
未來(lái)幾年,將有數(shù)以千億的手機(jī)、平板、可穿戴設(shè)備等各種智能終端,乃至各種感知設(shè)備接入到互聯(lián)網(wǎng)上,數(shù)據(jù)的總量將超過(guò)過(guò)去200年的總和,信息需求的巨大變化,會(huì)讓數(shù)據(jù)中心的集中化、規(guī)模化趨勢(shì)更加明顯。
有數(shù)據(jù)顯示,到2020年,70%的服務(wù)器將集中部署在5000臺(tái)以上規(guī)模的數(shù)據(jù)中心,將會(huì)有更多的超過(guò)50萬(wàn)臺(tái)規(guī)模的超大型數(shù)據(jù)中心出現(xiàn),服務(wù)器需求量的快速增長(zhǎng)與交付速度體術(shù)的停滯的差距,成為影響數(shù)據(jù)中心發(fā)展的重要瓶頸。因此更大交付顆粒的整機(jī)柜服務(wù)器,是未來(lái)數(shù)據(jù)中心主流服務(wù)器形態(tài)演變的趨勢(shì)。采用SmartRack能夠?qū)⒔桓缎侍嵘吮叮⑶覒{借集中供電、集中散熱和集中管理,降低至少15%的功耗和12%的TCO。
免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請(qǐng)發(fā)送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。