如何在不增加風險的情況下提高數據中心的密度和容量

2018.06.07

  随著(zhe)市場對(duì)于數據中心需求的增加,導緻了對(duì)于諸如計算輸出和存儲容量大小所需的增加,同時(shí)也需要更好(hǎo)地規劃未知的需求。然而,增加容量以滿足未來的計算需求所需的成(chéng)本代價可能(néng)是極爲昂貴的,并且,企業的工作負載并非總是可預測的。

  随著(zhe)現如今的企業越來越依賴于數據中心以提供服務,數據中心需要确保有足夠的容量以滿足潛在的業務的擴展。

  增加數據中心的環境密度和容量規劃可以幫助數據中心管理人員以有限的信息爲未來的業務做好(hǎo)準備。爲了實現這(zhè)一點,數據中心運營商們需要更清楚地了解自己的資源需求,即帶寬、計算輸出和存儲,以便适當地評估和調整難以預測的工作負載,例如來自物聯網的流量,這(zhè)一新興的互聯網連接的設備所收集和交換的海量數據。

  有效的電源管理和容量規劃的替代方法是浪費資金進(jìn)行過(guò)度的配置(無論是服務器還(hái)是雲服務),在面(miàn)臨意想不到的負載峰值時(shí)減少可用性,或者遷移到一個虛拟隊列的後(hòu)面(miàn),以等待共享資源。

  這(zhè)使得監控成(chéng)爲了基于衆多原因,對(duì)數據中心整體操作運營實施管理的重要因素,其中除了改進(jìn)維護活動的有效性之外,還(hái)包括減少意外停機中斷的次數和持續時(shí)間、有效的電源管理/分配、确保負載均衡的能(néng)力。

  剩下的保持靈活性,以滿足業務需求(無論該需求是否是企業所期望的)的挑戰,無疑是數據中心新的和新興的電源管理技術和方法的一個重要的推動因素。而本文旨在幫助廣大讀者諸君解決的關鍵問題包括:

  • 爲什麼(me)數據中心操作運營人員對(duì)高密度的數據中心越來越感興趣?

  • 高密度數據中心的關鍵要素是什麼(me)?

  • 企業組織如何充分利用高密度計算?

  • 我們可以從具有更高密度的數據中心學(xué)到什麼(me)經(jīng)驗教訓?

  • 更多的PDU插座數量和更高的服務器工作溫度有什麼(me)好(hǎo)處?

  當前數據中心行業的視圖

  數據中心管理的靈活性和成(chéng)本效益要求之間的平衡作用越來越不穩定。随著(zhe)房地産成(chéng)本的不斷飙升,使得企業組織很難通過(guò)將(jiāng)收購土地,以新建數據中心作爲一種(zhǒng)産能(néng)擴張的手段。而與此同時(shí),電費成(chéng)本無疑是占數據中心運營的最大頭的成(chéng)本;根據專注提供全球數據中心産業的調研和分析服務的DCD Intelligence在2014年的全球普查調研顯示,平均而言,對(duì)于持續運營的數據中心而言,27%的支出是在電源功率方面(miàn)。因此,上述一系列因素推動了數據中心行業全球性的服務器和功率密度的成(chéng)比數據中心密度和容量例增長(cháng)。

  對(duì)數據中心管理越來越模塊化的需求也與其他方面(miàn)的現實狀況有關,例如:

  • 數據中心重要性的日益增加,也使得企業的管理層需要面(miàn)臨更多的安全管理風險。而充分利用數據中心的空間則可以使其管理人員們更好(hǎo)地處理未來的需求。

  • 随著(zhe)數據中心的服務器機架變得越來越密集,其運行的成(chéng)本也越來越高,因此它們的“裝配”技術也在随之變得越來越複雜,并且變得依賴于網絡,而不僅僅隻是依賴于服務器。而且對(duì)于一個較小形式因素的更多的數據中心站點的需求也在增加。

  • IT負載變得不可預測,并且由外部源(例如移動設備所帶來的流量)所推動的峰值需求已經(jīng)變得或預期將(jiāng)變得更加極端。這(zhè)意味著(zhe),數據中心運營商們需要借助必須的基礎設施保持領先于業務需求的同時(shí),主動的滿足無所不在的需求,而不是當需求自身已然現身的時(shí)候才去滿足需求。

  • 數據中心更可能(néng)成(chéng)爲與共享服務競争的共享設施,并由此興起(qǐ)了許多關鍵架構 ——虛拟化、軟件定義、雲服務——數據中心抽象的物理屬性,并將(jiāng)其完全重組或部分重組到IT層。

  還(hái)有其他方面(miàn)的因素推動數據中心運營商們運營更密集的數據中心,包括諸如公衆的監督。政府監管機構和公衆輿論迫使數據中心運營商們必須更加節能(néng)和使用綠色環保技術,但同時(shí)也有來自于其自身的提升能(néng)源效率,以節省成(chéng)本的強大經(jīng)濟動力。更大的基礎設施已被(bèi)證明,通過(guò)采用更有效的電源管理和冷卻策略,能(néng)夠幫助運營商節省數十萬美元的運營費用。

  數據中心電力需求增加的影響

  随著(zhe)數據中心的需求不斷增長(cháng)以及房地産成(chéng)本的飙升,該行業正在适應創造更高的機架密度作爲一種(zhǒng)提前容量規劃的手段。充分理解了這(zhè)一點,便有助于我們了解功率密度和容量規劃在全球數據中心的增長(cháng)框架。具體而言,自2013年以來,電力消費持續穩步增長(cháng),尤其是在新興市場。而預計這(zhè)一強勢增長(cháng)的節奏將(jiāng)一直持續到2017年。這(zhè)種(zhǒng)快速的增長(cháng)已經(jīng)給數據中心運營商、管理人員和客戶們帶來了壓力,迫使他們急需找到更有效的方法來更有效的使用數據中心的空間和電力資源。由于這(zhè)兩(liǎng)大因素對(duì)于數據中心的設計是至關重要的,業界專家們正在將(jiāng)更具模塊化和靈活性的設計納入到他們的數據中心和設備機架,以便爲未來的各種(zhǒng)工作負載做好(hǎo)準備。

  DCD Intelligence最近的研究表明,鑒于對(duì)數據中心需求的不斷增長(cháng)所導緻的對(duì)于電力資源消耗的不斷增長(cháng),即使世界上最先進(jìn)的市場(美國(guó)市場)的增長(cháng)速度已經(jīng)呈現放緩趨勢,但其電力資源的消耗需求也仍然隻會(huì)不斷增長(cháng)。 該項研究已經(jīng)跟蹤數據中心行業的發(fā)展和快速增長(cháng)持續十年了。如下圖1所示,在過(guò)去幾年中,全球數據中心行業的功耗一直穩步增長(cháng),目前全球數據中心行業功耗的估計達45GW或更多。重點要注意的是,盡管諸如虛拟化、電源優化技術得到了廣泛而快速的普及采用,同時(shí)每瓦的計算效率也得到了大幅度的提高,但這(zhè)種(zhǒng)電力消耗的增長(cháng)仍將(jiāng)繼續。

圖1:全球數據中心行業的電源需求(單位:GW)

  更高的密度作爲解決方案

  解決這(zhè)些問題并幫助管理增加的需求的關鍵技術進(jìn)步是高密度計算的發(fā)展,或者在相同的機架空間内增加計算能(néng)力的能(néng)力。

  高密度計算或將(jiāng)帶來大量的成(chéng)本節約,但同時(shí)也會(huì)帶來一些挑戰。數據中心必須爲高密度機架配置額外的電源,而機架内部安置PDU的空間可能(néng)會(huì)變得非常緊湊。在這(zhè)些類型的環境中的冷卻需求也可能(néng)變得非常複雜。然而,通過(guò)精心設計的架構,數據中心運營商們則可以充分利用高密度計算所提供的空間和效率優勢。

  DCD Intelligence將(jiāng)高密度計算定義爲將(jiāng)更大的計算能(néng)力打包在同一空間中并因此需要在該空間中提供更高的功率的實踐。通常,數據中心中的每台機架能(néng)夠提供2-4kW的功率,但是今天,技術的進(jìn)步允許每台機架能(néng)夠提供20-30kW或更多。除了提供給機架的總功率的增加,可以被(bèi)認爲是高密度(即大于10kW /機架,包括IT和非IT需求)的機架的比例也在全球範圍内迅速增長(cháng)。詳細信息,請參見下圖2。 DCD Intelligence針對(duì)全球數據中心普查(DCD Intelligence針對(duì)數據中心決策者的調查)的分析發(fā)現,在過(guò)去5年中,機架功率密度穩步增長(cháng),而這(zhè)一趨勢還(hái)將(jiāng)繼續。詳情請參見下圖4。

圖2:高密度的主要優勢:相同數量的機架中處理更多的計算

  更高密度的機架/計算可以以多種(zhǒng)方式實現。首先,通過(guò)使用新的單一服務器可以簡單地在相同規模大小的機架中提供更多的計算能(néng)力,這(zhè)在很大程度上是由于處理能(néng)力的改進(jìn)。第二,刀片服務器,被(bèi)設計爲開(kāi)槽以增加計算能(néng)力;或高密度的pod,將(jiāng)冷卻和電源插座集成(chéng)到一個獨立的模塊化設計。最後(hòu),更高的機架支持更多的設備,因此帶來了更高的功率密度。

  改進(jìn)的基礎設施管理:

  高密度計算還(hái)帶來了每台機架内的非IT設備的減少,這(zhè)爲數據中心可管理性提供了額外的好(hǎo)處。數據中心可以具有更少的機架和更少的布線,這(zhè)可以由于減少了複雜性和更少的組件而帶來更高的可靠性。例如,有時(shí),數據中心可以具有更少但更大的機櫃功率,也稱爲分支電路,并且在面(miàn)闆上具有更少的保險絲或斷路器。這(zhè)也适用于用戶從單相上進(jìn)入三相電源的情況。

  密度推動的功率效率:

  盡管高密度計算增加了基于每個機架的功率消耗,但其可以顯著降低終端用戶的計算負載的總功率需求。如下圖3所示,超過(guò)40%的數據中心預計他們的電力需求將(jiāng)在2015年出現增長(cháng),其中五分之一的企業預計其大幅增長(cháng)將(jiāng)達到10%-30%之間。因此,減少功率浪費和提高計算效率的能(néng)力是數據中心并重的兩(liǎng)大目标。

圖3:全球數據中心行業2014年至2015年年度的電力需求變化

  更好(hǎo)地理解高密度計算:

  DCD Intelligence將(jiāng)高密度的門檻定義爲每台機架10kW。他們的研究表明,在企業組織内,IT決策者們對(duì)于高密度計算的意識仍然相對(duì)較低,這(zhè)些決策者們對(duì)于确切構成(chéng)高密度的因素、這(zhè)種(zhǒng)方法的成(chéng)本和收益及其财務影響有著(zhe)不同的見解。許多企業甚至不知道(dào)20kW及更高的密度是可能(néng)的。他們對(duì)于數據中心業界的其他創新的了解,例如冷卻設計的改進(jìn)也受到了限制。 DCD Intelligence發(fā)現,企業往往試圖複制他們在往年所做的一切,而并沒(méi)有探索他們是否可以通過(guò)采用更有效的數據中心設計來節省成(chéng)本。

  盡管整個數據中心業界的決策者們對(duì)于高密度機架的意識還(hái)很低,但更高密度的機架的比例在全球範圍内也正強勢增長(cháng)。 根據DCD Intelligence對(duì)全球數據中心普查的調研分析發(fā)現,在過(guò)去5年中,整個業界的機架功率密度穩步增長(cháng)。詳細信息,請參見下圖4。

  這(zhè)些數據表明,數據中心管理人員和IT專業人員正在制定關于采用高密度機架的目标,并且他們對(duì)于增加密度機架配置的興趣正在發(fā)生改變。

圖4:全球低、中、高密度機架的比例

  而諸如Server Technology(一家位于内華達州裡(lǐ)諾市的領先的機架式PDU制造商)等等這(zhè)樣(yàng)的供應商的産品也已經(jīng)發(fā)生了相應的變化,以滿足數據中心不斷增長(cháng)的電源和插座要求。在2013年至2016年期間,該供應商所銷售的每台PDU的插座數增加了46%;這(zhè)反映了企業客戶對(duì)額外插座和更小的PDU外形尺寸的需求,該公司說(shuō)。 (參見圖5)。

圖5:2013年至2016年每台PDU的平均插座數量

  根據DCD Intelligence的調研顯示,那些電源需求量最大的企業客戶通常是有著(zhe)大型計算資源的用戶。 因此,高密度計算的優勢在于其能(néng)夠爲具有大型計算資源的企業産生最直接的效益。 因此,我們預計:雲計算提供商、數字媒體公司和電信提供商是最有可能(néng)操作更高密度計算環境的。

  總體而言,随著(zhe)全球數據的爆炸似增長(cháng)所推動的對(duì)于數據中心的更大的存儲和處理的需求,高密度計算所占的比例越來越大。物聯網和雲計算隻是兩(liǎng)大主要的增長(cháng)推動因素,存儲和處理越來越多地從本地設備遷移到了遠程數據中心的雲中。

  根據思科的全球雲指數(2014-2019)顯示,到2019年,數據中心流量將(jiāng)以25%的年複合增長(cháng)率(CAGR)增長(cháng)3倍,達到10.4 zettabyte(1澤字節 = 1,000艾字節)。

  此外,根據全球雲指數(2014-2019)顯示,每年由萬聯網(Internet of Everything)設備所創建的數據將(jiāng)從2014年的134.5澤字節達到2019年的507.5澤字節。到2019年,超過(guò)五分之四的(86%)工作負載將(jiāng)通過(guò)雲數據中心進(jìn)行處理。

  當前的電源管理環境

  一台服務器所消耗的每千瓦時(shí)的功率會(huì)産生等量的熱量。在缺乏有效的監測和管理的情況下,這(zhè)種(zhǒng)熱量將(jiāng)積累在數據中心内。更重要的是,這(zhè)會(huì)影響到服務器性能(néng)。在近些年,服務器在更高溫度下正常運行的能(néng)力已經(jīng)得到改善;而計算密度,也就(jiù)是每台服務器所提供的計算能(néng)力的數量也得到了改善。随著(zhe)計算能(néng)力的增加,産生的熱量也随之增加。虛拟化服務器在數據中心的增長(cháng)也導緻了在數據中心的空閑計算機的大幅減少,進(jìn)一步增加了散熱。

  鑒于計算密度的上升(見上圖5),而且企業業務對(duì)于數據中心的依賴性也在不斷上升,所以企業必須妥善的管理好(hǎo)電源。然而,許多電力和冷卻系統無法有效地适應今天數據中心的需求。例如,當機架密度相對(duì)較低時(shí),傳統的基于周邊的CRAC單元的高架活動地闆充足,每機架2-4kW。現在這(zhè)種(zhǒng)情況則很少了。随著(zhe)計算能(néng)力根據摩爾定律的增加,服務器所消耗的功率使得這(zhè)對(duì)于許多數據中心操作者來說(shuō),成(chéng)爲了一個更大的問題。

  除了更大的性能(néng)退化或甚至造成(chéng)停機中斷的風險,這(zhè)種(zhǒng)增加的計算密度還(hái)會(huì)對(duì)數據中心電源功率/熱管理造成(chéng)兩(liǎng)大問題:

  • 更多的計算能(néng)力直接轉化爲數據中心産生更多的散熱,這(zhè)通常意味著(zhe)需要更多的冷卻基礎設施。較之10年前,新的服務器和交換機在每平方英尺可以産生多達10倍的熱量。

  • 高密度服務器通常安裝在與上一代系統相同的數據中心中。因此,機架密度不是在數據中心内均勻的增加的,故而某些區域將(jiāng)比其他區域更熱。此外,機架底部的設備可能(néng)消耗更多的冷空氣,使得剩餘量的冷空氣不足以冷卻機架頂部的設備。因此,冷卻架構需要允許更多的目标,而不是簡單地將(jiāng)數據中心溫度保持在ASHRAE指南範圍内。

  DCD Intelligence與Server Technology公司的軟件和産品管理高級總監Calvin Nicholson及其OEM和全球客戶總監Marc Cram共同探讨了智能(néng)電源和熱管理以及其他方面(miàn)的問題。

  随著(zhe)移動數據流量的增加,對(duì)數據中心基礎設施的壓力隻會(huì)進(jìn)一步的增加,而諸如汽車等連接設備的上線而變得更加明顯,這(zhè)意味著(zhe)更多的設備通過(guò)Wi-Fi接入網絡,會(huì)在全球範圍内創造更多的數據處理需求,從而對(duì)數據中心提出額外的要求,Cram指出。

  他補充說(shuō),除了諸如亞馬遜、谷歌和微軟這(zhè)樣(yàng)的超大規模公有雲服務供應商之外,更多的房地産企業更難以負擔得起(qǐ)在許多地區建造數據中心的高昂成(chéng)本。因此,越來越多的企業正在研究如何最大限度地利用現有的資源。

  因此,數據中心運營商們正在檢查機架的功率容量,以确定潛在的密度,他補充說(shuō)。

  Server Technology公司的Nicholson建議企業組織在查看他們數據中心的機架密度時(shí)特别需要留意以下幾點:

  監控的重要性。在分支和in-feed級别進(jìn)行容量能(néng)力規劃,是相當重要的,得以能(néng)夠通過(guò)尋找到僵屍服務器和閑置容量來實現更高的效率。 “您數據中心無法對(duì)沒(méi)有實施監控的設備進(jìn)行良好(hǎo)的管理。”Nicholson建議說(shuō)。因此,借助監控工具,可以幫助公司跟蹤和報告特定設備的功耗情況。這(zhè)是很重要的,因爲配置一台新服務器的決定應該是基于過(guò)去一年中機架的功率和冷卻??曆史記錄而做出的,而不是單一時(shí)間點。Nicholson所遇到過(guò)的最有問題的情況是數據中心運營商沒(méi)有适當地規劃或評估最大可能(néng)的正常運行時(shí)間和可靠性。随著(zhe)密度的增加,服務器和數據中心的維護也應該随之改變。爲此,如果設備在較高的溫度下運行,監控可以幫助延長(cháng)服務器的3到5年的使用壽命周期,Nicholson說(shuō)。 “這(zhè)是一個很棒的省錢機會(huì)。”他說(shuō)。此外,增加機櫃的入口溫度也是節省資金的一個相當不錯的方式,這(zhè)樣(yàng)服務器隻是持續在較高的溫度條件下長(cháng)時(shí)間運行。

  配置。這(zhè)是數據中心運營商在正确了解了氣設備可靠性和正常運行時(shí)間的重要性之後(hòu)必須接受并采取行動的關鍵原則。企業組織往往將(jiāng)過(guò)度的電力配置到未充分使用的機櫃,導緻不必要的運營支出。而鑒于當前房地産成(chéng)本的不斷上漲,這(zhè)種(zhǒng)情況在未來更難以爲繼。此外,配置錯誤類型的電源可能(néng)與這(zhè)些原則是背道(dào)而馳的,反過(guò)來會(huì)對(duì)數據中心操作的産生負面(miàn)影響。因此,Nicholson先生建議數據中心運營商們在更高的功率源(例如415v)條件下進(jìn)行配置,假設數據中心的冷卻設備可以處理由此伴随的需求。

  結論

  關鍵數據,研究結果和建議概述如下:

  關鍵數據:

  數據中心容量的總體增長(cháng)將(jiāng)推動對(duì)高密度計算的需求。據DCD Intelligence的分析預測,全球數據中心的白空間從2013年的3380萬平方米增長(cháng)到2017年的4130萬平方米,而數據中心的功率消耗將(jiāng)從2013年的41.4 GW增加到2017年的51.7GW。其中大部分增長(cháng)將(jiāng)發(fā)生在新興市場,并且主要是在托管服務、電信服務商、雲服務和其他IT服務提供商之間。

  數據中心的增長(cháng)部分的原因是由于數據的持續爆炸似增長(cháng)所推動的,思科預計,到2019年,每年的CAGR將(jiāng)增長(cháng)3倍,達到10.4澤字節(1澤字節 = 1,000艾字節)。

  數據中心的空間正在迅速成(chéng)爲該行業的一個問題,DCD Intelligence指出,的有六分之一的受訪者指出,缺乏合适的數據中心選址已然成(chéng)爲最近全球數據中心普查中的一個重要關注問題。有趣的是,即使在過(guò)去并不特别關注數據中心空間的提供商們現在將(jiāng)其稱爲潛在的問題

  對(duì)于最終用戶的建議:

  ① 對(duì)于高密度計算的教育和意識水平仍然很低,可能(néng)會(huì)有很大的混亂。企業需要投入時(shí)間和精力預先告知自己的員工們關于高密度計算和密集環境方法的優勢,以确定其是否是正确的方法。

  ② 企業應該計劃制定靈活的解決方案,允許數據中心業務的增長(cháng),而不需要更換設備或擴大設施。企業還(hái)應該牢記高密度模塊化的優勢,特别是在數據中心可能(néng)有有限的機架空間,但可能(néng)還(hái)能(néng)夠提供更多功率的情況下。這(zhè)可能(néng)允許企業增加計算能(néng)力,而不需要增加額外的設施。戰術性的解決方案可以是采用具有支持具有相同形狀因素的更多插座的機架PDU,其具有支持許多不同服務器數量和配置的靈活性。

  ③ 高密度不是像刀片服務器這(zhè)樣(yàng)的特定技術的同義詞。雖然刀片服務器可能(néng)是提供高密度解決方案的一部分,但企業應該意識到,其并不是簡單地將(jiāng)刀片服務器打包到機架中,電源的監控和管理更爲重要。這(zhè)是一個更廣泛的努力方向(xiàng)。

  ④ 雲計算和數字媒體的全球提供商最可能(néng)是使用高密度計算的最初的采用者。這(zhè)些公司將(jiāng)很好(hǎo)地評估更高的功率和服務器密度的潛在好(hǎo)處,以及爲其各自業務提供更好(hǎo)的服務。

  ⑤ 在高密度投資之前,建議企業投資于詳細規劃。對(duì)當前和未來需求的細緻理解對(duì)于提高潛在效率是至關重要的。

  企業可以從模塊化的增長(cháng),空間和功率效率的改善,以及潛在的更高的可靠性,更密集的環境中受益。大規模計算資源的企業用戶,例如雲計算提供商,特别适合于規劃高密度計算,但是對(duì)于各種(zhǒng)可能(néng)利用更密集的環境的企業而言,必須以已經(jīng)采取了必要的步驟爲假設前提。我們建議所有類型的企業均評估采用更高密度數據中心所提供的設備,方法和機會(huì),我們希望本文將(jiāng)有助于就(jiù)這(zhè)方面(miàn)所涉及的關鍵問題和可實現的好(hǎo)處爲廣大讀者諸君提供一些高層次的洞察。

  在企業組織和多租戶的數據中心中,更高密度服務器的趨勢已經(jīng)成(chéng)爲對(duì)數據中心不斷增長(cháng)的需求的主要響應之一。然而,密度越高,與之伴随著(zhe)的故障失敗,資源和支持需求的相應增加,也對(duì)帶來相關的風險的增加,因此要求數據中心運營人員提高運營效率。對(duì)更高密度機架的能(néng)力的需求,需要以合理和系統的方式仔細進(jìn)行規劃,監控和管理,以适應不斷變化和不斷增長(cháng)的需求。智能(néng)和集成(chéng)的PDU系統是實現這(zhè)一目标的一個主要因素。