數據中心遷移,最怕遇到這(zhè)幾個問題

2018.06.18

企業要更換辦公地址的時(shí)候,最頭疼的問題就(jiù)是搬遷據中心,數據中心的搬遷可不是搬家那麼(me)簡單,是否能(néng)順利搬遷,將(jiāng)成(chéng)爲保障企業業務連續性的關鍵要素,IDC數據中心的選擇過(guò)程將(jiāng)圍繞最适合環境的變量展開(kāi),如何定義需求、選擇合适的IDC提供商及協商實際遷移到新空間的細節等因素,都(dōu)需要進(jìn)行嚴格地評估,下面(miàn)看看從預置的數據中心遷移到IDC數據中心注意事(shì)項。

數據中心遷移常見的問題

(1)領導不明确

在規劃階段最常見的錯誤是未能(néng)建立明确的領導。這(zhè)意味著(zhe)在遷移過(guò)程中的各個階段中要确定誰負責明确的溝通,帶領團隊。在一個單一的部門,默認情況下會(huì)采用代表他們最佳利益的領導方式。該項目負責人必須公平公正,他需要理解并準确地反映了每個團隊的目标和成(chéng)功的标準。這(zhè)個人還(hái)必須有要求很好(hǎo)的執行權力和溝通技巧,以保持每個人緻力于實現同一目标。

(2)缺乏一個完整的基礎設施評估

在探索過(guò)程中最常見的錯誤是缺乏一個完整的基礎設施評估。特别是對(duì)于每個機架和每個設備的文檔和其相關聯的應用程序。這(zhè)一評估應該注意所有的東西,包括物理和虛拟設備,網絡設備,網絡拓撲等,不要因爲沒(méi)有這(zhè)些設備而走捷徑,遷移太多的信息遷移。

提示:包括評估業務和技術的相互依存關系。例如,應用程序,網絡和數據庫服務器等相關的應用程序必須作爲一個包進(jìn)行遷移。

(3)低估遷移時(shí)間

在實際的遷移過(guò)程中,一個常見的錯誤是沒(méi)有設定現實的時(shí)間預期。生産遷移本質上比測試遷移要慢,因爲它們需要更多的照顧和關注細節。

提示:使用測試遷移來評估實際遷移時(shí)間。你會(huì)驚奇地發(fā)現一些應用程序需要多長(cháng)時(shí)間。不要期待遷移過(guò)程會(huì)爲此等待。

(4)進(jìn)行設置,(實際上)卻遺忘

在新的基礎設施管理過(guò)程中最常見的錯誤是擁有“設置(實際上)卻遺忘”的心态。每個人都(dōu)很興奮,恨不得立即著(zhe)手遷移。這(zhè)時(shí)要确保技術和業務穩步進(jìn)行,而不要遺漏任何細節。

提示:在完成(chéng)遷移後(hòu),在48小時(shí)内至少花費一些時(shí)間進(jìn)行主動監測和支持。

(5)認爲大功告成(chéng)

在規模階段最常見的錯誤,就(jiù)是認爲現在大功告成(chéng),而失去了動力,這(zhè)些話可能(néng)會(huì)在遷移的過(guò)程中,超出了企業設置年度計劃,維持季度審查,并制定特設的基礎設施需求的計劃。

企業剛剛投入了大量的時(shí)間、精力和金錢,投入到一個艱難的過(guò)程中。現在不要因爲遷移已經(jīng)結束,就(jiù)失去動力或不再關注細節。這(zhè)不是爲數據中心遷移的唯一模式,而這(zhè)些肯定不是唯一的錯誤的人做。這(zhè)并不是數據中心遷移的唯一模式,當然這(zhè)些錯誤并不是人們所犯的全部錯誤,還(hái)會(huì)有其他的錯誤發(fā)生。這(zhè)裡(lǐ)最重要的是在不斷更新流程中,企業的技術、操作要求,以及經(jīng)驗都(dōu)在發(fā)生變化。

預置的數據中心遷移到IDC數據中心,幾個關鍵注意事(shì)項:

(1)位置(物理位置和IT人員的位置)

就(jiù)像在房地産市場選房一樣(yàng),選址永遠都(dōu)是最重要的。就(jiù)IDC提供商而言,選址意味著(zhe)該地區能(néng)夠提供的資源,位置對(duì)數據中心資産的安全性及良好(hǎo)的可用性有很大的影響。應該考慮到當地氣候 (洪水、極端溫度波動、風暴頻率及強度)、地震曆史和關鍵基礎設施(如線路、道(dào)路及機場)的可用性。對(duì)于必須更嚴格遵守法規(如金融行業)的行業,可能(néng)會(huì)禁止在國(guó)際甚至國(guó)家邊界地區爲客戶提供存儲數據的業務。

同樣(yàng)的原則也适用于支持員工。無論是否保留自己的員工,還(hái)是讓IDC提供商提供人員維護,都(dōu)需要了解IDC對(duì)人員安排。雖然一些IDC租戶仍然可以保留現場的IT人員,其他租戶則完全將(jiāng)其作爲合同的一部分進(jìn)行外包,在進(jìn)行下一步計劃前,根據自身情況制定一個檢測程序的計分卡,目的在于盡可能(néng)減少潛在供應商,這(zhè)對(duì)于租賃IDC空間的客戶而言是個中肯的建議。

(2)冷卻系統運行情況

獲得固定電力來源之後(hòu),IDC空間中冷卻系統是必不可少的。在優化冷卻成(chéng)本和效率方面(miàn),電源使用效率(PUE)是至關重要的。PUE可以顯示與機架交付電力有關的支出費用是多少。理想情況下,租戶隻需將(jiāng)功耗(計量的)乘以PUE系數,以表明冷卻所需的額外功率。尋找使用混合冷卻技術(例如,利用自然冷卻)IDC,保障制冷系統的冗餘。

(3)擁有DCIM軟件

盡管DCIM 軟件已成(chéng)爲管理數據中心的标準,但并不是所有的IDC提供商都(dōu)能(néng)提供完整的技術支持。因爲數據中心曆來有很多專用設備,這(zhè)些設備具有很多複雜的技術,而管理這(zhè)些技術可能(néng)會(huì)出現問題。通常情況下,設備都(dōu)有管理軟件,但是個别軟件系統可能(néng)無法兼容或集成(chéng)。這(zhè)將(jiāng)導緻數據中心内的混亂情況。所以要确保IDC提供商要具有DCIM軟件。了解數據中心所有的系統是否互聯?所有的傳感器都(dōu)連接到軟件并由這(zhè)些軟件監控嗎?它們能(néng)夠動态地生成(chéng)儀表闆及報告并快速移動到場地、機櫃及機架級嗎?他們具有端到端的資産管理能(néng)力嗎?他們已經(jīng)集成(chéng)到其它 ITSM系統(IT服務管理系統)并使您可以利用最需要的功能(néng)嗎?

(4)物理安全狀況

如果沒(méi)有嚴密的金融資産安全保證,任何銀行都(dōu)别妄想正常運營。數據中心資産也同樣(yàng)如此,這(zhè)可能(néng)隻包含人力資本之外的最有價值的資産。對(duì)于真正需要安全的設施,請堅持任用内部安全團隊。在分析安全模式時(shí),一定要評估内部安全人員、分層的安全區、攝像頭及安全系統,這(zhè)些系統可以360度覆蓋,且具有高級安全認證,如PCI DSS 2.0、SSAE 16和ISO 27002.

(5)電力供應情況

電力既是一個廣義的問題,也是一個狹義的問題。在宏觀層面(miàn)上,需要考慮區域電網基礎設施的穩定性及冗餘能(néng)力。尋找發(fā)電站、變電站、電纜到數據中心的距離、位置以及對(duì)于整個配電系統的冗餘的考慮。确保沒(méi)有電力限制會(huì)IDC區域的運行。這(zhè)聽起(qǐ)來覺得有些遠,但是如果你經(jīng)曆過(guò)拉閘限電,或者用電高峰期或季節性供應而停電,就(jiù)不會(huì)如此認爲。不要忘記對(duì)當地最近電力中斷和維修記錄進(jìn)行了解,以便制定對(duì)應的應急計劃。

在微觀層面(miàn)上,需要考慮在IDC空間内進(jìn)行電力監測。他們是否能(néng)精确量化計量功率,是否具有随著(zhe)時(shí)間的推移增加或降低功耗的靈活性,從而清楚目前使用電力的情況?他們是否有辦法檢測、監測并緩解電力激增和其他異常?當電力中斷發(fā)生在與外部電源無關的托管設施中時(shí),他們的備份和災難恢複計劃是什麼(me)?所有這(zhè)些都(dōu)需要仔細考慮。

(6)服務等級協議(SLA)

通過(guò)明确的SLA可以爲租戶提供可見性和管理工具,這(zhè)是建立良好(hǎo)持續關系的基石,可以主動避免沖突,選擇正确的托管服務提供商時(shí),創建或擁有良好(hǎo)的SLA并建立明确的劃界線至關重要,通常,SLA可以根據具體的租戶需求和正在托管的資産進(jìn)行調整。 這(zhè)意味著(zhe)識别關鍵工作負載,應用程序,服務器等。

它強調的是,當您爲數據中心IDC付費時(shí),您購買的是關鍵的基礎設施和正在進(jìn)行的維護,您要确保SLA包括維護和測試。尋找備有證明文件的MOPs(程序法)和SOPs(标準操作程序),不斷地使用并改進(jìn)。還(hái)要确保他們包括良好(hǎo)的管理工具來監測電源、冷卻、機架情況、具有常規的正常運行時(shí)間及狀态報告的環境,并提供日志聚合工具,用于收集各種(zhǒng)服務器、系統和安全日志進(jìn)行分析。這(zhè)樣(yàng),寶貴的時(shí)間可以花在識别和解決潛在問題上,而不是互相推诿責任。

(7)工作負載和工作流管理情況

在檢查完所有物理因素之後(hòu),現在應該關注工作負載的傳送方式以及工作流程的管理方式,關于組織通過(guò)數據中心嘗試提供的數據或應用程序的類型,有幾個關鍵的考慮因素,雲和大數據將(jiāng)繼續發(fā)展和改變組織如何分配數據,特别是當信息在多個位置之間分配時(shí),現在可以比以往任何時(shí)候都(dōu)更有效和快速地傳送信息,IT視野正在由“數據點播”,BYOD(自帶設備)和物聯網(物聯網)等重要轉變塑造,因此您希望确保您的托管服務提供商不僅在 - 但是,也能(néng)夠保持這(zhè)樣(yàng)做,因此它不會(huì)使您的數據中心管理過(guò)時(shí)的速度比應用程序更快。

同樣(yàng),平衡工作負載,連續性和災難恢複對(duì)于可持續性至關重要,數據必須移動的距離和托管提供商提供的帶寬量可能(néng)意味著(zhe)偉大的用戶體驗與失敗的托管部署之間的差異,他們的工作流管理系統是否或者他們有多好(hǎo),可以幫助确定某些數據和基礎設施組件的交付優先級。 此外,它將(jiāng)有助于确定哪些需要具有較高的正常運行時(shí)間要求與優先級較低的應用程序相比,在瓶頸或緊急情況下,您將(jiāng)能(néng)夠首先訪問最重要的信息。

預置的數據中心遷移到IDC數據中心的風險與對(duì)策

風險一:服務可用性

數據中心的主要目的就(jiù)是,托管運行爲業務提供服務的應用程序。無論你何時(shí)考慮從一個數據中心遷移到另一個數據中心,必須首先考慮底層服務的可用性。這(zhè)些服務包括:活動目錄之類的基礎設施應用程序和SAP之類的面(miàn)向(xiàng)客戶的應用程序。

當服務從一個數據中心轉移到另一個數據中心時(shí),你必須制定一項策略,特定的服務何時(shí)遷移和應用程序對(duì)彼此的依賴關系都(dōu)必須考慮進(jìn)來。确保服務可用性的一個常見做法就(jiù)是,建立遷移組,然後(hòu)把互相依賴的應用程序分到同一組。

至于支持大多數企業應用程序的服務,比如活動目錄和DNS,一個常見做法就(jiù)是,跨數據中心擴展這(zhè)些核心服務。服務依然在兩(liǎng)邊的數據中心,直到遷移完成(chéng)。

風險二:數據遷移

將(jiāng)應用程序數據從一處遷移到另一處可能(néng)是數據中心遷移工程的最複雜的環節之一,一種(zhǒng)簡單的方案就(jiù)是執行基于磁帶或硬盤的備份,并執行恢複,不過(guò),類似平移遷移,備份和恢複在及時(shí)恢複服務方面(miàn)提供的能(néng)力很有限。另外,備份和恢複并不是最适合數據遷移的理想方法――它更适合數據恢複方案有限的災難恢複這(zhè)種(zhǒng)場景。

爲大多數數據遷移選擇的主要方法是配置一條租用線路。如果兩(liǎng)個數據中心之間有了一條專用連接,遷移團隊就(jiù)能(néng)充分利用基于硬件或軟件的同步機制,執行數據遷移。除了能(néng)夠遷移數據外,這(zhè)個方法還(hái)可以用來執行P2P遷移、P2V遷移和虛拟機到虛拟機(V2V)遷移。

許多企業決定在兩(liǎng)個數據中心之間擁有多條連接。連接至少需要兩(liǎng)條線路:一路連接支持平常的最終用戶和數據中心到數據中心的流量,以便支持活動目錄等應用程序和應用程序到應用程序的流量;第二路、通常速度更快的連接用來執行數據同步。雙路連接可以防止兩(liǎng)種(zhǒng)全然不同的流量幹擾或影響對(duì)方。

風險三:硬件遷移

遷移物理服務器通常有兩(liǎng)種(zhǒng)策略:一種(zhǒng)名爲“平移”(lift and shift),另一種(zhǒng)名爲數據複制,在平移策略中,硬件放到活動卡車上,然後(hòu)安裝到新的數據中心。系統在搬到新址之前已備份好(hǎo),不過(guò)這(zhè)個策略會(huì)帶來一些風險。

最大的風險之一是物理服務器可能(néng)在搬運過(guò)程中遭到損壞,搬運過(guò)程中的損壞會(huì)導緻備份毫無用處。另一個挑戰就(jiù)是兩(liǎng)個數據中心相隔太遠,因而這(zhè)個方法不現實,無法保證服務在可以接受的時(shí)間段内可用。

第二種(zhǒng)策略是通過(guò)一條租用線路來進(jìn)行數據遷移。租用線路帶來了兩(liǎng)種(zhǒng)sub-swing硬件方案。一種(zhǒng)方案是執行物理機到物理機(P2P)遷移。P2P遷移需要購置同類硬件,以便原有數據中心的應用程序和硬件可以遷移過(guò)去,同時(shí)确保停機時(shí)間最短。

另一種(zhǒng)硬件遷移方案是物理機到虛拟機(P2V)轉換。P2V需要通過(guò)租用線路,將(jiāng)物理機轉換成(chéng)虛拟機。

P2V旨在實現兩(liǎng)個目标:

第一個目标是,將(jiāng)工作負載從一個數據中心遷移到另一個數據中心,同時(shí)确保硬件成(chéng)本最低。

第二個目标是,通過(guò)轉移到虛拟平台,實現數據中心轉型。P2V遷移是大受歡迎的方案,因爲許多工程師已經(jīng)習慣于執行這(zhè)種(zhǒng)轉換,這(zhè)是之前數據中心項目的一部分。

總結:

將(jiāng)數據中心遷移到IDC中可能(néng)對(duì)業務來說(shuō)是至關重要的,三思而後(hòu)行,一定要考慮以上列出的主要的因素、注意事(shì)項與風險,記住,所有的托管提供商都(dōu)是不一樣(yàng)的,你越能(néng)選擇最好(hǎo)的托管提供商,就(jiù)越能(néng)從遷移中得到更多的價值和更加平和的心态。