服務器集群的故障檢測需要做些什么工作?集群服務設計的目的就是為了提高服務器的性能,同時在出現故障的時候能夠迅速的進行故障轉移,提高服務器的性能,所以在集群服務器剛開始設計的時候,就格外注意服務器集群的故障轉移方案。
服務器集群的故障檢測需要做些什么工作?集群服務設計的目的就是為了提高服務器的性能,同時在出現故障的時候能夠迅速的進行故障轉移,提高服務器的性能,所以在集群服務器剛開始設計的時候,就格外注意服務器集群的故障轉移方案。
a.發送信號。對于發送信號,活動服務器以定義好的時間間隔將指定信號發送到備用服務器。如果備用服務器在某個時間間隔內未收到信號,則確定活動服務器發生了故障并擔任活動角色。例如,活動服務器每隔30s 將狀態消息發送到備用服務器,如果設定的備用服務器注意到在90s (3 個時間間隔〉內未收到任何狀態消息,那么它會接管活動服務器的工作。
b.接收信號。對于接收信號, 備用服務器向活動服務器發送請求。如果活動服務器沒有響應,則備用服務器按特定次數重復發送此請求。如泉活動服務吉普仍然沒有響院,則備用服務器接管活動服務器的工作。例如,備用服務器可能每一分鐘將Get Customer Details 消息發送給活動服務器。如果備用服務器發送Get Customer Details請求3次,但未收到響應,此時,備用服務器將接管活動服務縷的工作。
集群可以使用多個級別的信號。例如,集群可以在服務器級別使用發送信號,并在應用程序級別使用一組接收信號。在此配置中,每當活動服務器啟動并連接到網絡時它都將心跳消息發送到備用服務器。這些心跳消息是按比較頻繁的時間間隔(如每隔Ss)發送的,而備用服務器可能通過編程設置為僅當未收到兩個心跳消息,就接管活動服務榕的工作。也就是說,在活動服務器發生故障后不超過10s 的時間內,備用服務器將檢測到這一故障并啟動備用進程。
以上發送和接收信號是通過專用通信通道發送的,以使網絡擁塞和一般網絡問題不會導致假的故障轉移。此外,備用服務器可能將查詢消息發送到運行在活動服務器上的一個或多個關鍵應用程序,并在指定的時間間隔內等待響應。如果備用服務器收到正確的響的,則不采取任何進一步的行動。為了將對活動服務器性能的影響減少到最小,應用程序級別的查詢通常要經過比較長的時段,如每隔一分鐘或更長。備用服務器可能通過編程設置為:一直等到至少已經發送5次請求但未收到響應,然后才接管活動服務器的工作。這意味著,可能在長達5min之后,備用服務器才會啟動故障轉移進程。所以,集群故障轉移也是有一個時間間隔的,并不能保證無縫接管。
以上就是對服務器集群的故障檢測需要做些什么工作的具體內容介紹了,希望對你有所幫助。
上一篇:服務器集群的故障轉移方案是什么
免責聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,也不承認相關法律責任。如果您發現本社區中有涉嫌抄襲的內容,請發送郵件至:operations@xinnet.com進行舉報,并提供相關證據,一經查實,本站將立刻刪除涉嫌侵權內容。