應對(duì)數據中心靈活性的挑戰

2018.07.12

今天的數據中心好(hǎo)比是一台複雜的“機器”,幫助企業在數字經(jīng)濟發(fā)展中飛速前行。 事(shì)實上,擁有數據中心的政府、企業、公司依賴于數據中心的在線不間斷的運行爲各自發(fā)展帶來效益。那麼(me),萬一運行運行處出現故障時(shí),會(huì)怎樣(yàng)? 業務突然中斷會(huì)因此造成(chéng)多少損失? 最重要的是,數據中心生态系統的靈活性會(huì)如何?

Ponemon Institute(一家研究所)最近發(fā)布一份最新的“數據中心停機成(chéng)本”研究成(chéng)果。曾經(jīng)在2010年和2013年也發(fā)布過(guò),這(zhè)回發(fā)布的結果主要是繼續分析數據中心意外中斷的造成(chéng)的損失。 據這(zhè)份新報告顯示,數據中心業務中斷的平均成(chéng)本從2010年的505502美元穩步上升至今天的740357美元(或淨增幅爲38%)。

在對(duì)63個數據中心做出研究後(hòu),發(fā)現:

自2010年第一次研究以來,宕機成(chéng)本增加了38%.

大多數依賴數據中心的企業的停機時(shí)間成(chéng)本比平均水平快。

自2013年以來,最大宕機成(chéng)本增加32%,自2010年以來增長(cháng)81%.

2016年最大宕機成(chéng)本爲2,409,991美元。

考慮到這(zhè)一點 - 讓我們來看看組織如何應對(duì)數據中心的靈活性,從而有效保障數據中心持續運營。

。 數據中心業務中斷。數據中心不是一個完美的“機器”。事(shì)實上,運維人員必須意識到,在數據中心,可以由于任何原因導緻任何事(shì)情發(fā)生。這(zhè)種(zhǒng)狀況同樣(yàng)适用于新的雲技術以及那些即將(jiāng)到來的新技術。許多組織仍然將(jiāng)雲視爲一個真正的分布式模型,組織利用雲技術爲數據中心建立多個冗餘從而維持數據中心最長(cháng)的運行時(shí)間。事(shì)實上,這(zhè)些組織這(zhè)麼(me)做并不可取。因爲沒(méi)有一個數據中心運行是100%安全,都(dōu)會(huì)或多或少的遇到某種(zhǒng)類型的嚴重的情況或緊急情況。2012年6月暴風雨幾乎毀了亞馬遜全部的數據中心。該數據中心負責什麼(me)?亞馬遜網絡服務。該數據中心負責的亞馬遜網絡業務全部都(dōu)受到不同程度的影響,業績下滑,效率降低。像Instagram,Netflix和Pinterest這(zhè)樣(yàng)以雲業務爲核心的公司,業務宕機長(cháng)達6個多小時(shí)。爲更清晰地描述雲計算的靈活性,國(guó)際工作組爲此做一次調研。這(zhè)份調研報告顯示,自2007年以來,已經(jīng)有13個重要運行商被(bèi)記錄有568個小時(shí)宕機時(shí)間。到目前爲止,這(zhè)給客戶帶來的損失超過(guò)7200萬美元。

另外一個雲業務中斷的例子,是由于IT管理員忘記更新SSL證書,導緻企業大量數據丢失。這(zhè)樣(yàng)的事(shì)件不僅導緻雲平台故障,還(hái)引發(fā)全球級聯效應,導緻很多雲平台同時(shí)出現故障。誰是雲供應商? 微軟Azure. 微軟爲Azure平台建設與設計投入150億美元。該平台可在12個小時(shí)内恢複基本運行,其它程序恢複恢複需要24小時(shí)。約有52個依賴Azure平台的Microsoft服務遇到問題,其中包括Xbox 與Live network.

通過(guò)管理數據中心來改善持續運行。 數據中心自下而上的設計方式允許架構在建設初期允許提高整個數據中心環境設施級别。

随著(zhe)等級的限定與設備的集成(chéng),數據中心運營商將(jiāng)注意力全部集中在如何有效保障系統安全運行。 數據中心通過(guò)使用先進(jìn)的管理系統時(shí),可以監控數據中心溫濕度等環境變量。 這(zhè)意味著(zhe)通過(guò)優化連接、使用虛拟傳感器、維護客戶端可以管理多個數據中心, 這(zhè)種(zhǒng)管理系統具備了創建下一代數據中心四個要素:

可靠性。 良好(hǎo)的管理系統將(jiāng)爲您提供有關整個數據中心模型的詳細細節。;并且,能(néng)夠有助于維持環境的可靠性。 這(zhè)也就(jiù)意味著(zhe)可以通過(guò)管理系統更有效的使用冷卻系統,電源系統、氣流組織管理系統,從而達到降低PUE.

性能(néng)。 通過(guò)數據中心管理系統可以數據中心的全貌,可以清楚的看到數據中心重要設備表現性能(néng)。管理系統可以幫助運維人員發(fā)現數據中心運行潛在問題在确定故障出現之前。同時(shí),還(hái)可以通過(guò)管理系統發(fā)現數據中心哪裡(lǐ)氣流組織不好(hǎo),可以在密度高的機櫃周圍安裝傳感器。可持續發(fā)展行 數據中心管理的越好(hǎo),數據中心可持續性能(néng)越高。 安全運行意味著(zhe)可以有效降低管理數據中心運營成(chéng)本。 在管理數據中心期間,确保對(duì)每項系統都(dōu)做全面(miàn)的了解。從長(cháng)遠來看,做好(hǎo)有效管理,效率提升幅度會(huì)繼續提高。

安全。 良好(hǎo)的管理不僅可以讓您了解數據中心環境細節,還(hái)可以幫助運維人員有效應對(duì)挑戰。 您可以通過(guò)管理系統檢測到開(kāi)放式機架内某些設備被(bèi)關閉或者訪問不當等。 維護數據中心的始終要圍繞著(zhe)安全進(jìn)行。

數據中心運營商能(néng)夠滿足當下業務水平服務所需唯一方式是優化的數據中心管理技術。數據中心運維經(jīng)理必須以自下而上的方式來看待數據中心。當您在優化數據中心管理系統考慮到以上這(zhè)些因素時(shí),會(huì)逐漸擺脫數據中心應對(duì)靈活性時(shí)面(miàn)對(duì)的真實威脅。