數據中心的運維管理六大原則

2018.04.27

“三分技術,七分管理”。大量的事(shì)實表明,數據中心的好(hǎo)與差評判标準都(dōu)是由管理水平的高低所決定的。一個數據中心即便采用了最新的技術,或者擁有上萬台服務器,數百名技術專家,也不一定是一個好(hǎo)的數據中心。一個好(hǎo)的數據中心會(huì)利用本身現有的技術和設備,向(xiàng)用戶提供服務,將(jiāng)運維成(chéng)本降到最低,而使利潤最大化。而現有的數據中心往往都(dōu)采用粗犷式管理方式,業務分散,有些資源不夠用,而有些資源又處于閑置,資源之間無法均衡,數據中心的運維成(chéng)本一般會(huì)占到總運營成(chéng)本的12%以上,這(zhè)樣(yàng)的數據中心將(jiāng)成(chéng)爲企業的沉重負擔。現有的數據中心在負載均衡,災難恢複,數據流分析,資源占用分析等方面(miàn)的問題都(dōu)漸漸凸顯出了數據中心管理上的不足。想要管理好(hǎo)數據中心,讓數據中心高效地運行,我們要遵循數據中心管理的六大原則。

原則一:機房乃立業營運之本,承載數據中心之搖籃。

機房是數據中心運營的依托主體,沒(méi)有機房何談數據中心,因此數據中心的絕大部分工作都(dōu)是圍繞數據機房展開(kāi)的。作爲數據中心機房,它要具有基本的運營能(néng)力和抵抗災害的能(néng)力。對(duì)機房進(jìn)行管理和優化,是數據中心開(kāi)展一切工作的基本。具體來講,機房一般包括: 配電系統、防雷接地系統、綜合布線系統、消防系統、門禁系統、空調系統、人員考勤系統等等。在日常管理中,要對(duì)這(zhè)些系統的運營狀況進(jìn)行監控,有隐患及時(shí)排除,有缺陷及時(shí)優化,确保不影響數據中心的正常運營。

原則二:以“數據服務”爲核心,方顯數據中心應用本色。

數據中心運營的關鍵是要向(xiàng)外提供各種(zhǒng)各樣(yàng)的數據服務,這(zhè)些服務才是數據中心利潤的來源,數據中心的所有工作都(dōu)是爲了保障向(xiàng)外提供更多服務。數據中心内的各種(zhǒng)設備,如:存儲、網絡、服務器、應用軟件、防火牆等等,要加強對(duì)這(zhè)些設備和軟件的管理,确保向(xiàng)外提供穩定的數據服務。随著(zhe)信息技術的不斷發(fā)展,數據中心也應該不斷引入新的技術,新的服務形式,跟随信息技術變革的潮流,源源不斷地提供越來越豐富的數據服務。讓數據中心持續保持旺盛的生命力。

原則三:安而不忘危,治而不忘亂,存而不忘亡。

人要居安思危,方能(néng)立于不敗之地。對(duì)數據中心管理也要時(shí)刻保持有一種(zhǒng)危機感。華爲在十年前就(jiù)高喊冬天來了,狼來了,結果換來了十年的高速發(fā)展,雖然已經(jīng)成(chéng)爲世界最大的通信設備商,仍在喊嚴冬依然沒(méi)有過(guò)去,要員工做好(hǎo)長(cháng)期艱苦奮鬥的準備。數據中心的管理人員要有這(zhè)種(zhǒng)危機感、使命感,在數據中心穩定運行的時(shí)候,也要時(shí)刻保持警惕,防止意外發(fā)生,小心駛得萬年船。在日常管理中,要做足預防工作,避免危險出現。經(jīng)常進(jìn)行模拟故障演習,比如:業務切換、設備倒換、部分設備斷電等等操作,确保業務不中斷。對(duì)數據中心的日常運營、未來發(fā)展做好(hǎo)規劃。讓數據中心穩定、快速的向(xiàng)前發(fā)展。

原則四:明者遠見于未萌,而智者避危于無形。

數據中心裡(lǐ)危機四伏,任何一個沒(méi)有注意的隐患都(dōu)可能(néng)引發(fā)故障。試想想如果一個數據中心有數十萬的服務器設備,那麼(me)幾乎每天都(dōu)會(huì)有設備故障,要保證這(zhè)些故障不影響到數據中心的業務,就(jiù)需要做好(hǎo)預案,一旦發(fā)生這(zhè)些故障,數據中心該如何切換業務,确保業務穩定。在數據中心日常管理中,要及時(shí)發(fā)現故障隐患,將(jiāng)危險扼殺在搖籃之中,亡羊補牢,悔之晚矣。所以能(néng)在危險暴露之前就(jiù)消除,付出的代價最小。

原則五:建設循規蹈矩,質量重于泰山。

和生産一款産品一樣(yàng),數據中心的建設和運維質量同樣(yàng)重要。數據中心建設質量的好(hǎo)壞,關系到數據中心運行生命周期的長(cháng)短。從數據中心建築建設、設備采購、改造等都(dōu)要主抓質量,并不是所有的地方都(dōu)要用貴的設備和材料,前期一定要做好(hǎo)審核,尤其是關鍵部件,質量一定要過(guò)硬。建築避免豆腐渣工程,采購的設備性價比要高。《聖經(jīng)》中曾記載一個這(zhè)樣(yàng)的故事(shì):巴比倫國(guó)王尼布加尼撒夢見一個巨大雕像,頭是金的,胸和腎是銀的,腹和腰是銅的,腿是鐵的,但腳是半鐵半泥的。這(zhè)樣(yàng)的雕像看似巨人,足卻是泥捏的,一推即倒。數據中心的質量也一樣(yàng),不能(néng)放過(guò)任何一個環節,否則數據中心就(jiù)可能(néng)成(chéng)爲泥足巨人。主抓質量往往意味著(zhe)成(chéng)本的增加,但帶來的將(jiāng)是長(cháng)久的穩定。

原則六:運維管理無小事(shì),節能(néng)增效保平安。

随著(zhe)數據中心容量的增加、規模的擴大以及新型設備與技術的引入,數據中心運行與維護的難度也在加大,但仍不能(néng)放松心态,運維管理無小事(shì),一旦出現問題,帶來的損失不可想象。運維工作作爲數據中心生命周期中最長(cháng)、最重要的階段,應該作爲長(cháng)期的管理工作來抓。在确保數據中心穩定運維的同時(shí),要關注數據中心的節能(néng)。現在的數據中心能(néng)耗過(guò)大,已經(jīng)引起(qǐ)了數據中心管理者的關注。在中國(guó),政府的能(néng)源開(kāi)銷,每年大約110億美元,其中來自IT設備的就(jiù)占到了50%,并且每年還(hái)在以8~10%的速度在增長(cháng),這(zhè)樣(yàng)的數據不得不讓政府推出一系列節能(néng)減排的政策。我國(guó)信息化基礎設施非常先進(jìn),已經(jīng)基本與發(fā)達國(guó)家同步,特别是上網用戶已經(jīng)躍居全球第一。龐大的信息需求引發(fā)了海量的數據中心建設,某著名的互聯網企業規劃建設一個巨型數據中心,可容納15萬台服務器,設計用電量約60MW,已經(jīng)相當于一個中型發(fā)電廠的總功率。數據中心已經(jīng)成(chéng)爲用電量增長(cháng)最快的行業,龐大的數據中心數量和規模,已經(jīng)讓電力工業不堪重負,數據中心理應走在節能(néng)的前列,提升數據中心運營能(néng)效。

無論如何,提高數據中心性能(néng)、降低數據中心能(néng)耗、降低數據中心運維成(chéng)本始終是數據中心管理人員的終極目标。通過(guò)深入地理解數據中心管理的六大原則,將(jiāng)使得數據中心管理工作變得簡單,有效。