關于可用性的計算
通常在一般情況下,數據中心行業用于計算可用性的公認的公式其實并未真實準确的反映數據中心操作運營現場的實際停機時(shí)間。整個數據中心行業也承認這(zhè)一事(shì)實。但是,與之其可能(néng)用于支持關鍵負載的總時(shí)間量相比,該行業通常并沒(méi)有任何其他方法來計算設備“用于服務”的時(shí)間量。
業界普遍接受的用于計算可用性的公式如下:
Ai = MTBF / (MTBF + MTTR)
其中,Ai是固有的或隐含的可用性,MTBF是平均故障間隔時(shí)間,而MTTR是平均修複時(shí)間。
此公式的目的是爲了使設備的所有者能(néng)夠就(jiù)其UPS系統達到其使用壽命期限,并將(jiāng)停止服務的時(shí)間量建立一個合理的期望值。但是,根據名爲《最大化UPS可用性》的白皮書準确地說(shuō)明了使用這(zhè)種(zhǒng)方法所存在的諸多問題。最重要的是,這(zhè)種(zhǒng)方法未能(néng)將(jiāng)機械設備在檢查、一般性維護、故障排除、等待技術員到達或等待零件裝運期間實施關閉的時(shí)間包括在内。因此,UPS設備實際的服務時(shí)間將(jiāng)進(jìn)一步下降,而其停機中斷的實際時(shí)間量遠大于該公式所計算得出的值。在大多數情況下,對(duì)于數據中心的所有者、設施管理人員和維護提供者而言,想要真實準确的計算出某款特定設備的實際服務時(shí)間量的确是相當困難的,無論該設備是否是在運行中。存在這(zhè)種(zhǒng)困難的原因就(jiù)在于設備本身并不能(néng)記錄服務于企業業務的開(kāi)始/停止時(shí)間,這(zhè)其中缺乏在實際執行工作任務時(shí)向(xiàng)企業組織報告的能(néng)力。由此所導緻的結果便是:精确确定的一款設備的服務時(shí)間段與一款設備實際執行其預期工作的時(shí)間段方面(miàn)存在巨大差距。
而靜态UPS系統的制造商們解決可用性問題的一種(zhǒng)方式便是通過(guò)UPS中的一個靜态旁路,將(jiāng)第二電源并入到方程式中。通過(guò)這(zhè)樣(yàng)的方式,上面(miàn)的計算方程公式就(jiù)變成(chéng)雙電源。主電源(整流器,電池和逆變器)的可用性現在得以能(néng)夠與一個靜态旁路的MTBF和MTTR耦合。在以下兩(liǎng)種(zhǒng)情況下,這(zhè)種(zhǒng)解決方案是非常不錯的:您企業的靜态交換機開(kāi)關必須傳輸,而備份電源(實用程序)必須可用。因此,盡管現在隐含可用性更大,但實際的可用性則是相同的。如果UPS脫機,無論工作負載是否來自旁路,UPS實際上都(dōu)是不可用的。
關于操作的可用性
關于可用性的真正的衡量方法是操作的可用性,在這(zhè)種(zhǒng)測量方法中,一款系統在運行時(shí)的總時(shí)間被(bèi)表示爲其所需要的總時(shí)間的百分比。
AO =正常運行時(shí)間/運行周期
該公式考慮了所有可能(néng)造成(chéng)服務中斷或造成(chéng)設備恢複使用延遲的因素。這(zhè)些因素可以包括從等待技術人員的到來;到等待設備零件的配備等等方方面(miàn)面(miàn)。這(zhè)個公式衡量了企業客戶實際經(jīng)曆的停機時(shí)間,無論這(zhè)類停機時(shí)間是計劃内的還(hái)是計劃外的。
盡管估計一款設備在發(fā)生故障失敗之前能(néng)夠正常運行多長(cháng)時(shí)間(MTBF),以及對(duì)其實施修複需要花費多長(cháng)時(shí)間(MTTR)固然是很好(hǎo)的,但這(zhè)樣(yàng)做的話就(jiù)不能(néng)爲一旦一款開(kāi)始投入服務可能(néng)發(fā)生怎麼(me)的狀況提供切合實際的期望。現在,考慮到構成(chéng)典型的關鍵任務基礎設施(例如,并聯開(kāi)關設備、自動轉換開(kāi)關、開(kāi)關設備和發(fā)電機)的所有附加組件,故而一款關鍵任務系統的可用性的計算變得非常困難也是相當明顯的了。
項目概況
使用Euro-Diesel柴油動态UPS上提供的實時(shí)數據,使得計算每款系統中的每個模塊的運行可用性成(chéng)爲了可能(néng)。 在這(zhè)個例子中,我們使用了由E1 Dynamics INC.公司在美國(guó)打造的第一個項目的數據。 這(zhè)個爲美國(guó)聯邦政府所開(kāi)展的項目包括兩(liǎng)個階段。第一階段涉及在2009年9月委托的一款單一的2,000kVA / 1,600kW柴油旋轉式UPS系統(DRUPS)模塊;第二階段,是在2011年8月委托的冗餘2,000kVA / 1,600kW DRUPS.該系統最初設計爲易于擴展, 使得添加第二模塊的更容易。
DRUPS:操作可用性
在DRUPS的正常操作運營期間,工作負載通過(guò)一個連接到DRUPS交流發(fā)電機的扼流圈進(jìn)入。 對(duì)于被(bèi)認爲“受保護”的工作負載,交流發(fā)電機應該是旋轉的。 交流發(fā)電機有兩(liǎng)個電源:第一個是公用供電公司,第二個是柴油發(fā)動機。 其中一個或另一個必須可用于交流發(fā)電機旋轉。
這(zhè)便是可以計算實際可用性的領域了。該款Euro-Diesel No-Break KS具備在交流發(fā)電機旋轉期間,跟蹤确切時(shí)間的獨特能(néng)力。在這(zhè)段時(shí)間内,工作負載受到保護。使用這(zhè)些數據,我們能(néng)夠計算操作可用性。
通過(guò)上面(miàn)的示例,很容易計算出操作的可用性。2014年,DRUPS B的在線服務支持負載時(shí)長(cháng)達8,752.1小時(shí)。2014年的總時(shí)間爲8,760小時(shí)。通過(guò)這(zhè)些數字可以計算得出99.91%的操作可用性。換句話說(shuō),該款DRUPS一年内的總離線時(shí)間共計爲7.9小時(shí)。這(zhè)個數字是所有維護、修理、診斷和緊急服務時(shí)間的總和。
當對(duì)較長(cháng)時(shí)間段内的數據進(jìn)行檢查時(shí),設備的整個生命周期中的操作可用性開(kāi)始變得明顯。DRUPS B于2009年9月投産。我們的數據收集于5個月後(hòu)開(kāi)始。截至2016年6月,該款設備在線運行時(shí)間總計達55,400小時(shí),其中總的運行小時(shí)數爲55,536.操作可用性爲99.76% ——即一年的維護,診斷,故障排除和維修停機時(shí)間僅爲21小時(shí)。
意外停機時(shí)間
進(jìn)一步對(duì)數據進(jìn)行檢測觀察,我們可以查找異常,以便幫助我們确定設備的生命周期問題,操作問題或服務相關事(shì)件。2014年DRUPS A就(jiù)經(jīng)曆過(guò)這(zhè)樣(yàng)的事(shì)件。該設備停用服務時(shí)長(cháng)總共爲153小時(shí)。柴油發(fā)動機的制造商被(bèi)要求讓設備離線以執行工廠召回。之後(hòu)該DRUPS才恢複了服務。
這(zhè)種(zhǒng)類型的事(shì)件將(jiāng)不會(huì)對(duì)使用MTBF和MTTR的理論上的可用性産生任何影響。其不是公式的一部分。使用操作可用性作爲度量,可以計算其影響。此外,加上153小時(shí)到總小時(shí)數(8,572.1 + 153),産生了99.84%的操作可用性。將(jiāng)該值與模塊B相比較,可以确定DRUPS可能(néng)離線的總時(shí)間的良好(hǎo)基線。