有人會說,我買我自己的物理機可以做上面的優(yōu)化,效果比主機好。這是真的嗎?現實是:絕大多數公司管理服務器的數量不多,不足以建立相應的團隊;同時因為服務器的數量(如不低于百萬單位)、硬件和軟件的優(yōu)化環(huán)境不理想。
有人會說,我買我自己的物理機可以做上面的優(yōu)化,效果比主機好。這是真的嗎?現實是:絕大多數公司管理服務器的數量不多,不足以建立相應的團隊;同時因為服務器的數量(如不低于百萬單位)、硬件和軟件的優(yōu)化環(huán)境不理想。
下面就上述要點展開。
這主要通過自主掌控虛擬化層和宿主機內核,這整套內核來實現。
1. 自主維護Linux內核
商業(yè) Linux 發(fā)行版(如 RHEL6.X)的內核其實有不少 BUG,因為內核太龐大、太復雜,BUG 修之不盡而且不斷涌現,只要 內核有人在改動,更多的 BUG 就還在路上。
但我們自己維護的 Linux 內核,我們可以迅速修復并應用進實際環(huán)境,不像商業(yè) Linux 要等待較長的發(fā)布周期。
我們還可以預先研究別人犯過的錯誤,把更新補丁打入現在的內核;還可以屏蔽不必要的特性和改動避免 BUG 的引入。
簡單講,自主維護內核很靈活,最終質量不低于商業(yè) Linux 發(fā)行版。國內有海量服務器的公司如騰訊和阿里都運行自主維 護的 Linux 內核。
2. 免重啟熱補丁技術
這是指通過二進制指令修改的方式修改 Linux 內核達到修復的目的。
結合自主維護 Linux 內核,如果發(fā)現了 BUG 并制作修復補丁后,可以免重啟應用到生產環(huán)境的 Linux 內核里。
這點目前主流 Linux 廠商不提供。但
云平臺廠商可以自己做。
3. 熱遷移技術
特殊情況下的熱遷移,可規(guī)避尚未完全定位的內核問題。
這三點的綜合效果,使得某些云廠商,因為內核原因造成的宕機低到可以忽略。幾萬臺服務器半年可以減少到一兩次。
可能有些早期用戶應該比較有感覺,幾年軟件宕機不少,給客戶推送的故障報告不時就和內核有關,但經過一年半載的工作 后,現在幾乎沒有了。