服務(wù)器集群故障怎樣檢測?現(xiàn)在有很多的企業(yè)為了安全或者為了網(wǎng)站優(yōu)化能有一個(gè)更好的效果選擇使用站群服務(wù)器進(jìn)行網(wǎng)站搭建,那么服務(wù)器集群出現(xiàn)故障怎么辦?該如何檢測呢?這里為大家具體介紹一下服務(wù)器集群故障怎樣檢測。
服務(wù)器集群故障怎樣檢測?現(xiàn)在有很多的企業(yè)為了安全或者為了網(wǎng)站優(yōu)化能有一個(gè)更好的效果選擇使用站群服務(wù)器進(jìn)行網(wǎng)站搭建,那么服務(wù)器集群出現(xiàn)故障怎么辦?該如何檢測呢?這里為大家具體介紹一下服務(wù)器集群故障怎樣檢測。
在集群節(jié)點(diǎn)之間的通信允許集群服務(wù)檢測節(jié)點(diǎn)故障和狀態(tài)改變并且將集群作為一個(gè)實(shí)體進(jìn)行管理。可以為這種節(jié)點(diǎn)到節(jié)點(diǎn)的通信設(shè)立多重網(wǎng)絡(luò)以便于消除單一點(diǎn)的故障。在集群節(jié)點(diǎn)上運(yùn)行的集群服務(wù)跟蹤集群中節(jié)點(diǎn)的當(dāng)前狀態(tài),并且確定組及其資源何時(shí)故障轉(zhuǎn)移到備用節(jié)點(diǎn)。這種通信采用在每個(gè)節(jié)點(diǎn)的集群服務(wù)之間定期發(fā)送消息的形式進(jìn)行。這些消息被稱為“檢測信號”,或稱“心跳氣”。
通過心跳通信,每個(gè)節(jié)點(diǎn)可以恰查其他節(jié)點(diǎn)及它們的應(yīng)用程序的可用性。如果服務(wù)器設(shè)有對心跳通信;做出響應(yīng),則正常工作的服務(wù)器會啟動(dòng)故障轉(zhuǎn)移過穩(wěn)(包括對故障服務(wù)器擁有的資源和應(yīng)用程序的所有權(quán)進(jìn)行仲裁)。仲裁是使用質(zhì)詢和辯護(hù)協(xié)議來執(zhí)行的。換而言之,如果某個(gè)節(jié)點(diǎn)似乎發(fā)生了故障,則會在給定的時(shí)間內(nèi)允許它以幾種方式中的任何一種表明它仍處于正常運(yùn)行當(dāng)中,并且可以向其他正常的節(jié)點(diǎn)通信。如果它無法證明自己正在正常運(yùn)行,則此時(shí)會將它移出集群。
多種事件都可能導(dǎo)致節(jié)點(diǎn)無法響應(yīng)心跳消息,如計(jì)算機(jī)故障、網(wǎng)絡(luò)接口故障、網(wǎng)絡(luò)放障,甚于在可能是由于少有的高峰活動(dòng)期。通常來說,當(dāng)所有節(jié)點(diǎn)進(jìn)行通信時(shí),配置數(shù)據(jù)庫管理器會向每個(gè)節(jié)點(diǎn)發(fā)送全局性的配置數(shù)據(jù)庫更新。當(dāng)心跳通信失敗時(shí),日志管理錦還會將配置數(shù)據(jù)庫的變更保存到仲裁資源中。這保證了幸存的節(jié)點(diǎn)可以在恢復(fù)過程中訪問最新的集群配置和本地節(jié)點(diǎn)的注冊表數(shù)據(jù)。
服務(wù)器集群故障怎樣檢測?以上文章為大家介紹的是檢測節(jié)點(diǎn)故障的方式檢測服務(wù)器集群故障,提醒大家的是故障檢測算法比較保守,所以我們要盡量多的給那些明顯發(fā)生故障的節(jié)點(diǎn)有質(zhì)詢的機(jī)會,才能進(jìn)入故障轉(zhuǎn)移過程。
免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請發(fā)送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。