因爲這(zhè)世界上還(hái)有一個(gè)工種叫運維。
服務器是非常容易壞的(de)。雖然單體損壞的(de)可(kě)能性非常低,這(zhè)是由服務器的(de)冗餘性設計來(lái)保障的(de)。但是當成百上千的(de)基數乘以這(zhè)個(gè)概率的(de)時(shí)候.....就天天忙到死了(le)。
我幫忙維護過一個(gè)30多(duō)台的(de)小機房(fáng)。企業内部自用(yòng),條件很一般。
破空調壞了(le),萬幸是冬天,直接開窗(chuāng)進冷(lěng)風。平時(shí)保持在27度的(de)服務器降到21左右。壯哉我大(dà)東北(běi)。
每次設備清灰都覺得(de)自己會得(de)塵肺阿....黑(hēi)色非常細的(de)靜電灰。
每次設備維護和(hé)調整都要選盡量晚阿。我們即使企業内部自用(yòng)的(de)。也(yě)得(de)等公司所有人(rén)下(xià)班了(le)才能開始操作,而且遇到加班的(de)要繼續等。
所有操作前第一個(gè)想法是備份備份備份。我錯删過VP兩個(gè)虛拟機我說什(shén)麽了(le)。。帶我的(de)組長(cháng)獨自恢複一陣列硬盤100+個(gè)虛拟機的(de)數據說什(shén)麽了(le).....
向不明(míng)真相的(de)小夥伴解釋爲啥服務器會壞?還(hái)是想辦法做(zuò)熱(rè)備份更容易吧。
也(yě)别嘲笑(xiào)我待的(de)環境差我們技術差。每一個(gè)運維都在努力讓自己的(de)設備達到各種6個(gè)9乃至9個(gè)9的(de)可(kě)靠性。隻能說我們盡力了(le)。
服務器在設計的(de)時(shí)候做(zuò)了(le)大(dà)量的(de)備份冗餘,在使用(yòng)的(de)時(shí)候運維在不停排除故障。在軟件層面大(dà)家一起努力設計了(le)hadoop,hdfs,lvs等等一系列的(de)維護系統和(hé)災後修複策略。
這(zhè)一切最終在用(yòng)戶看起來(lái)就是“服務器爲什(shén)麽不會壞”,因爲我們100%确定服務器一定會在不久的(de)将來(lái)壞掉。