數據中心最核心的“心髒”-電力系統

2018.07.09

如果不是爲測量心率,血壓,心電圖,你可能(néng)想不起(qǐ)來每年做回體檢。正如心髒是身體最重要的組成(chéng)部分一樣(yàng),電力系統基礎設施對(duì)于數據中心而言,也是重要的組成(chéng)部分。最保守的估計是電力系統中所有設備總值占整個數據中心資産價值的50-70%,(其中包含變壓器,母線、斷路器、線纜,UPS,配電櫃,發(fā)電機等。) 對(duì)于數據中心運營商而言,但凡運營中由于電力相關問題導緻的業務意外中斷的突發(fā)情況,無疑是他們心中最大噩夢。 無論從總體擁有成(chéng)本還(hái)是運營支出角度看,數據中心的“心髒”無疑都(dōu)是其電力系統。

(備注:EKG與ECG通用,到表示心電圖或體表心電圖。)

dianlixindiantu

shujuzhongxindianli

表1:數據中心資産分配

shujuzhongxindianli1

表2:數據中心運行成(chéng)本

如果隻關注IT服務器管理工具,就(jiù)像在體檢時(shí)隻檢查血糖水平,卻不檢查心髒一樣(yàng),忽略了數據中心内最重要的組件。那些放在封閉的房間,看起(qǐ)來陳舊的、顔色的陳舊的、灰色的櫃體,默默的在那裡(lǐ)運行著(zhe),保持數據中心持續運行,發(fā)出嗡嗡聲響,銷售在外面(miàn)跟客戶吹噓著(zhe)自己的IDC運轉速度都(dōu)快趕上TLC!這(zhè)就(jiù)是爲什麼(me)需要專門能(néng)源電力管理系統(EPMS)成(chéng)爲數據中心重要的組成(chéng)部分。正如建築物管理系統(BMS)爲冷卻和設備機械系統創建的可視化平台,可以更爲直觀的看到系統運行情況,及時(shí)發(fā)現狀況,同時(shí)系統能(néng)分析出有價值的電器資産。即使是數據中心基礎設施管理(DCIM)也不完全具備EPMS所具備的功能(néng),在設計上存在一些盲點。

(備注:TLC是閃存一種(zhǒng)類型,全稱爲Triple-Level CellTLC芯片技術是MLC和TLC技術的延伸,最早期NAND Flash技術架構是SLC(Single-Level Cell),原理是在1個存儲器儲存單元(cell)中存放1位元(bit)的資料,直到MLC(Multi-Level Cell)技術接棒後(hòu),架構演進(jìn)爲1個存儲器儲存單元存放2位元。

EPMS :電力能(néng)源管理系統軟件借助了計算機、通信設備、計量保護裝置等,爲系統的實時(shí)數據采集、開(kāi)關狀态檢測及遠程控制提供了基礎平台。該電力監控系統可以爲企業提供“監控一體化”的整體解決方案,主要包括實時(shí)曆史數據庫AcrSpace、工業自動化組态軟件AcrControl、電力自動化軟件AcrNetPower、“軟”控制策略軟件AcrStrategy、通信網關服務器AcrFieldComm、OPC産品、Web門戶工具等,可以廣泛地應用于企業信息化、DCS系統、PLC系統、SCADA系統。

BMS:建築設備管理系統,是建築設備自動化系統BAS、火災啓動報警系統FAS、安防自動化系統SAS的集成(chéng)。它主要具有各子系統之間的協調、全局信息的管理以及全局事(shì)件的應急處理能(néng)力)

看看EPMS都(dōu)在哪些方面(miàn)對(duì)數據中心有益:

1、電氣數據可視化

電氣數據一般需要7*24小時(shí)在線監測。 看看下面(miàn)具體例子。

a) 粒數據:來自電能(néng)表的數據有助于回答諸如“電路承載多少負載”等操作問題。 如果添加更多的服務器負載,會(huì)有風險? 變壓器是否超載?“及時(shí)訪問這(zhè)些數據可以優化負載,從而使資産得到保護,避免帶來的損害。

(備注:粒數據( grain data):基于時(shí)效性要求,能(néng)完整證明并真實記錄某一事(shì)件發(fā)生或存在的數據顆粒的最小集合,該集合的數據顆粒可以是多源的;該電子數據一旦産生即不可被(bèi)修改。粒數據的核心是證明某一事(shì)件的發(fā)生與存在,所以構成(chéng)它的數據顆粒都(dōu)需要具有該事(shì)件的屬性,我稱其爲粒标簽(grain lebal),粒标簽是在數據生成(chéng)時(shí)确立的,由數據産生各方依據規範在各自系統中自動生成(chéng),也可通過(guò)某種(zhǒng)技術(如區塊鏈)將(jiāng)各自産生的粒标簽統一存儲。依據标簽實現相同标簽的數據關聯(包括橫向(xiàng)與縱向(xiàng)),實現多源數據完整性整合與應用。)

shujuzhongxin2

表3 實時(shí)電氣運行屏幕

A.操作員屏幕:快速浏覽設備狀态信息以查看關鍵電源設備,如變壓器,UPS和斷路器等,幫助運營商識别可能(néng)會(huì)影響正常運營的故障。

B.及時(shí)的電氣報警:通過(guò)設置适當的報警阈值來識别電路過(guò)載;意外的斷路器跳閘;從而幫助數據中心操作人員在輕微問題升級到危機之前進(jìn)行有效幹預。 EPMS帶來更快的報警性能(néng)和準确的時(shí)間節點,這(zhè)兩(liǎng)者都(dōu)有助于确定響應報警條件的有效性。

C. 與維護相關的電氣數據:分析電路負載曆史能(néng)夠制定确切的運營維護計劃。 例如,中斷負荷分析以及後(hòu)續運行分析表明,斷路器的維護周期要比既定周期要短。相反,推遲定期維護也可能(néng)同樣(yàng)是有必要的,因爲有時(shí)候現有電氣設備負載較輕或者低于預期。這(zhè)種(zhǒng)有針對(duì)性的維護計劃可以在大型數據中心推廣,從而節省一定的運營成(chéng)本。

2. 改善電氣安全流程

在對(duì)數據中心運行、維護關鍵電源設備時(shí)需要注意安全。 在設備操作現場訪問設備數據時(shí),操作人員操作時(shí)需符合NFPA 70E标準要求的電弧閃光安全标準等規範和标準。 通過(guò)屏幕顯示的設備運行狀态,可以降低由于人爲疏忽導緻的問題帶來的災難性的傷害。畢竟,人爲錯誤仍然是數據中心業務中斷的主要原因(見圖5)。

電氣斷路器和開(kāi)關櫃通過(guò)軟件提供的“虛拟”标簽,可以幫助運營人員及時(shí)發(fā)現設備哪裡(lǐ)出現問題。此外,軟件的安全功能(néng)确保隻有與電氣設備相關的運維人員才可以訪問軟件。

3.根本原因分析和事(shì)件取證

由于全球氣候升溫,電網受到前所未有的壓力,所以停電并不常見。當面(miàn)對(duì)如此系統如此複雜的數據中心時(shí),難免會(huì)出錯。要明确發(fā)生什麼(me),更重要的是,要确認級聯事(shì)件的序列,以此确保事(shì)件不再發(fā)生。還(hái)有就(jiù)是額外功率電力管理系統功能(néng)十分便捷,特别是處理事(shì)後(hòu)危機。 以下是EPMS捕獲事(shì)件數據的三方面(miàn)經(jīng)驗是非常寶貴:

A.電氣報警:跟蹤電壓波動,例如:電壓下降或升高;斷路器跳閘,這(zhè)種(zhǒng)故障都(dōu)是由于誤操作導緻。無論是改善内部業務還(hái)是與市政部門協商電力質量合同,都(dōu)須先确認是否真有必要去做此事(shì)。

B.準确度高的事(shì)件順序報告:在電氣高速運轉的世界,接近秒或分鍾是遠遠不夠的, 精确到1到10毫秒分辨率是有必要的,以防止業務意外中斷:繼電器接錯,斷路器故障等。

C.電能(néng)質量波形分析:目前電氣系統的不足之處在于,能(néng)效的可靠性主要是通過(guò)UPS,轉換開(kāi)關作爲保障,這(zhè)要做的後(hòu)果是實際上會(huì)降低電源質量。 随著(zhe)停電的成(chéng)本持續上漲,采用EPMS可以通過(guò)波形分析工具來幫助分析電氣故障,諧波以及其他電氣幹擾等。 通過(guò)幹擾方向(xiàng)檢測工具可以快速隔離幹擾,爲事(shì)故發(fā)生後(hòu)處理節省寶貴時(shí)間。

shujuzhongxin3

表4 電力波形分析表

4.能(néng)源會(huì)計和成(chéng)本分配

對(duì)于數據中心運營商而言,保障數據中心的可靠性、正常運營是可以理解的,不過(guò),随著(zhe)業務發(fā)展,他們也許管理數據中心的能(néng)效。數據中心也引入精确度高 的工具對(duì)能(néng)耗進(jìn)行測量,從而更有效的爲托管客戶提供更爲精确的數據。EPMS可通過(guò)準确分配淨能(néng)源成(chéng)本(包括峰值需求和功率因子費用的輔助費用)來促進(jìn)托管計費。 在許多情況下,數據中心通過(guò)更準确地計費工具,可向(xiàng)客戶收取占收取費用很大比例的能(néng)耗成(chéng)本。

除了從外計費的IT客戶,許多數據中心的成(chéng)本核算流程現在都(dōu)需要在部門或成(chéng)本中心層面(miàn)進(jìn)行内部計費。 EPMS軟件通過(guò)大量計算,從而輸出應用所需的數據。

kechixufazhan

表5意外中斷分析

5.可持續發(fā)展和運營指标

管理人員現在希望數據中心人員能(néng)夠掌握這(zhè)些操作指标。 以下是EPMS可以提高可用指标的數量和質量的四個方面(miàn):

A.容量管理:通過(guò)分析電氣基礎設施中不同來源的電路負載,運營商評估它們是否可以安全地添加在特定區域的IT負載,而不會(huì)影響冗餘。

B.操作性能(néng):根據适用标準(如Green Grid recommendations)自動計算PUE,可使操作員更爲輕松制作各類表格。

yunxingmianban

運行面(miàn)闆

C.能(néng)源報告:能(néng)源消費報告在粒度級别的需要驗證的保護措施和采用節能(néng)性能(néng)符合的标準,如ISO50001.

(備注:ISO 50001能(néng)源管理體系全球标準ISO 50001已于2011年6月15日發(fā)布。將(jiāng)幫助各種(zhǒng)規模的企業了解各個工作流程的基準能(néng)源使用量,該标準制定旨在實施降低能(néng)耗的行動計劃、實現目标和能(néng)源績效指标,并識别、優先處理、和記錄各種(zhǒng)能(néng)源績效改善機會(huì),從而實現節約。

各種(zhǒng)全球性威脅,比如能(néng)源短缺、成(chéng)本上升,以及遏制溫室氣體排放立法的增加,在我國(guó),如“十二五”期間,我國(guó)确立了單位GDP能(néng)耗下降16%以及單位GDP碳排放強度下將(jiāng)17%的目标,以及《節約能(néng)源法》、《可再生能(néng)源法》、《循環經(jīng)濟法》、《清潔生産促進(jìn)法》、《森林法》、《草原法》等有利于減緩氣候變化的能(néng)源立法與環境立法的相繼頒布和實施,都(dōu)推動了該标準的制定。通過(guò)實施該标準,各種(zhǒng)規模的企業不僅有潛力實現大幅财務節約,還(hái)可以通過(guò)聲明其提升可持續發(fā)展的承諾,提高他們的聲譽。)

D.可持續發(fā)展報告:可持續性不再是董事(shì)會(huì)上可有可無的想法。 將(jiāng)二氧化碳排放作爲數據中心的業務目标和任務,需要一個穩固的計量系統作爲依據。

通過(guò)EPMS來關注數據中心的電力基礎設施,在這(zhè)方面(miàn)做出投資是值得的。單從投資回報率來看,這(zhè)種(zhǒng)投資可以比作“保險責任範圍”内,投資一部分資本換來的是高額的回報。

是的,建築管理系統當然可以在一定程度上整合電力設備,但BMS并不是完全針對(duì)電力系統開(kāi)發(fā)的軟件,BMS在管理機械系統方面(miàn)的應用無疑是不錯的,但是完全應用在電力方面(miàn)將(jiāng)會(huì)低估數據中心的價值。

不要擔心,與其他關鍵設施系統集成(chéng)已不再恐怖。 DCIM能(néng)越來越多將(jiāng)各種(zhǒng)組件集成(chéng)在一起(qǐ),建築管理,數據中心操作和電源管理都(dōu)在同一個操場上發(fā)揮得很好(hǎo)。

确保數據中心的電力系統得到良好(hǎo)的監控和調整 - 您的數據中心需要它的“心髒”在合适的位置。