影響服務器硬件故障率的一個品牌、類型、操作時間、服務器組件類型率。這項工作需要大量的服務器來做,比如成千上萬的有意義的,和成百上千的小的意義。
1.服務器故障率與廠商模型之間的密切關系
我們可以監控各廠家的故障模式,主動的幀速率,比較差,從而提高整體質量。
一般而言,小廠的服務器故障率會更高,但制造商甚至戴爾,聯想和個別型號將有更高的故障率。
這是主要和模型設計和生產質量控制,是沒有解釋。我們可以做的是選擇云
主機租用一個低故障率的生產廠家和型號。
2.服務器運行很長一段時間,故障率會增加對于
云平臺供應商來說,它可以監測故障前的征兆,并主動采取措施,以避免受云影響的熱量傳遞方式。
3.大的硬件和組件的停機時間缺陷
我們發現,統計,組件類型,硬盤故障率最高,其次是內存的硬件,磁盤陣列等。
對于硬盤故障,可以避免空襲。對于內存硬件,通過內存故障隔離內核的方法,大大減少了硬件故障停機時間及影響。
一般而言,通過上述工作,云平臺廠商可以讓服務器硬件故障率逐漸降低。事實上,你可以做的更多,不談
空間的原因。
這項工作是很難做到的,沒有大規模的環境,效果很差。
此外,云平臺為云供應商的用戶可以修補主機內核和漏洞的漏洞,減少故障率。
我們在這方面做了一些工作,內核版本更新,關鍵漏洞會提供免費恢復熱補丁修復。
簡要總結一下本文的主要觀點:
云主機相比物理機,虛擬化層和宿主機內核的額外復雜性及故障率可以被優化至接近 0 即可以忽略。
服務器硬件故障,云平臺可以不斷降低其故障率,主要手段通過內核隔離硬件故障、熱遷移規避故障隱患,以及監控故障率 并主動下架不良廠商機型等。