邁世·機房監控體驗端
用戶名:Admin密碼:(無密碼) 點擊體驗熱門關鍵詞: 動力環境監控系統 機房動力環境監控品牌 機房動力環境監控系統方案 機房集中監控
導語
如何提升供電系統的可用性是數據中心機房的重中之重,以確保能夠獲得清潔、持續的電力資源對于其機房供電系統而言是必不可少的,數據中心機房的健康運營需要依靠持續的清潔電力供應,然而,從電源系統設計的哪怕一絲一毫的缺陷到整個電網發生的故障,都可能導致即使是最現代和先進的機房陷入癱瘓,如何建立和維護一個高度可用的數據中心機房供電系統?下面我們一起來了解幾種解決方法。
1、首先審查電力系統
機房管理人員都認為,自己對于其電力系統的交付能力是清楚知道的,然而,事實上,真正能夠做到這一點的數據中心管理人員是少之又少,這是因為大多數企業并沒有定期對他們的電力基礎設施進行審計,只有通過審核電力系統,企業組織用來支持該系統的操作流程,才能夠建立數據中心的最大負載參數。
當需要把重要的新的IT工作負載投入生產,但卻因為電力不足而無法做到時,僅僅靠依托產品規格和承包商的承諾會讓企業暴露在容量能力不足的困難風險之下。
解決方案:定期徹底的審核您數據中心的電源系統。
2、采用標準化設施的工作流程
越來越多地機房利用標準化的最佳實踐框架,如信息技術基礎設施庫來幫助他們提高他們的工作流程系統化,不幸的是,一些企業的基礎設施部門采用了嚴格、統一的維護流程,如那些由ITIL定義的流程,而不是依靠特設的程序和基礎設施管理人員們所積累的專業知識。因此導致了數據中心電源和冷卻系統的維護標準往往較低,或與IT系統不太一致,進而導致了停機時間的增加。
解決方案:雖然基礎設施流程框架作為ITIL尚有待開發,但基礎設施部門可以而且應該采取相應的措施,以制定他們自己的標準化、文檔化的流程。按照一致的,可重復的方式進行必要的活動,可以顯著降低功率和冷卻故障的可能性,同時提高基礎設施技術人員的工作效率。
3、更換過時的舊設備
當你發現機房電力異??赡軙绊懙矫舾须娮釉O備的運行,并包括組件中斷,可能會對整個企業的業務產生重大影響,數據中心機房一般利用不間斷電源設備來防止電源異常。這樣的系統能夠清潔“臟”的電力系統,并在供電中斷期間提供應急電源。
然而,直到最近,相對于其功耗而言,可用性最高的雙轉換UPS 系統往往是效率最低的,反之亦然。因此,那些希望能夠盡量壓低運營成本的企業組織可能已經部署實施了節能的UPS產品,這類產品交付低于平均水平的可用性;而那些更關注正常運行時間的企業組織則部署實施了高可用性的UPS系統,同時也浪費了電力資源。
解決方案:今天,已充分市場充分驗證的成熟的UPS技術使得企業組織能夠在一款單一的設備中同時享受到高可用性和高效率。對于那些使用較舊的不間斷電源技術的企業組織而言,他們應考慮升級到這種新一代的設備,以便能夠提高應用程序的可用性,并同時降低總擁有成本。
4、著眼于長期價值,而不是短期成本
數據中心機房在建設或改造翻新時,短期的投入成本和企業長遠的價值二者之間的優先級別總是沖突的。企業的高級管理人員們通常都要督促負責數據中心建設的人員務必要盡可能的壓低成本,縮短完工時間。其結果是,在數據中心的建設項目中所涉及到的供應鏈參與者、工程師、承包商和項目經理們往往都是基于誰的報價最低、并承諾最快的設備交付,而做出設備的選擇決定,但如果這一價格水平的設備其實并不符合原數據中心建筑設計定義的操作規范的話,隨著時間的推移,其最終將以降低運營效率和正常運行時間的形式來讓企業組織付出昂貴的代價。
解決方案:當對一處數據中心的建設或改造翻新項目進行審查和決策時,企業的關鍵執行人員務必應該仔細審查采購決策,確保一線的項目管理人員和承包商并沒有以犧牲企業的長期利益為代價,來換取短期的成本壓縮。他們也應該清楚明確地傳達嚴格遵守數據中心原始設計操作規范的重要性,即使這意味著在施工過程中的花費會更多一點。
5、實現企業范圍內的監控和主動診斷
與流行的看法相反,很少有系統故障沒有提前發出過警告,除非是在發生了災害的情況下。僅僅只是系統所發出的警告太常被忽視,因為在本質上其是監控系統的自然反應,假設一款UPS在某個深夜發生了故障,進而造成了您企業組織數據中心運行中斷。那么很可能的情況則是,UPS已經在故障發生前的幾天或幾小時已經提前發出過相關的暗示或警號信號。例如,也許UPS或其電池已開始過熱或出現性能下降。然而,如果數據中心的基礎設施管理人員沒有監測到這些性能指標,他們可能也不知道即將發生的故障,直到其最終發生。
解決方案:最新的企業管理產品可以幫助企業監控和主動管理涉及到關鍵任務的設備,包括電力設備,環境和生命/安全系統。但是如若沒有經過事先的細致咨詢就匆忙上馬,那么,即使是最好的軟件也沒有什么太大的幫助。因此,盡管數據中心選擇部署電力系統監測和診斷軟件是一個重要的開始,但其基礎設施部門也必須確保他們有嚴格的工作流程提前為即將安裝的軟件進行咨詢,并迅速響應危險的跡象。
6、維護一個基礎設施變更管理數據庫
對于其所進行的所有維護程序都保持一份全面和準確的文檔記錄,對于確保機房的安全是至關重要的,此外,一旦發生事故,維修記錄可以為在第一時間找出造成潛在的災難性的系統故障的根本原因提供重要的線索,在緊急情況下,對于確保對于重要數據的及時訪問是至關重要的時候特別有價值。然而僅僅只有很少一部分的企業基礎設施部門維護了一套CMDB。其結果是,關于其數據中心的不間斷電源系統(UPS)或關于當前哪些服務器或其它相關負載正在被處理等等諸如此類的唯一記錄都只存在于管理人員的頭腦里。而一旦這位管理人員離職或退休,這些寶貴的紀錄便隨之離開了,這無疑會使得數據中心被暴露在不必要的停機風險之下,同時電源/冷卻設備受干擾后也將需要更長的恢復時間。
解決方案:企業數據中心的基礎設施部門應建立并嚴格維護他們自己的CMDB。ITIL的指導方針為這一舉措提供了一個有用的起點,企業組織也可以利用各種專門的CMDB軟件應用程序。
7、采用適合企業需求的電力系統拓撲結構
電力系統的拓撲結構對采購成本、運營費用、可靠性和平均維修時間有著重要的影響。對于一處既定的數據中心,您所設計的冗余越多,那么在其建造和運行過程中您企業所花費的成本也就會越多,但其也能夠更快地從中斷中恢復,國際正常運行時間協會(The Uptime Institute)是一家專為企業數據中心的業主和運營商服務的獨立的研究機構。該機構為數據中心的關鍵任務設施定義了四項電源系統拓撲結構來說明這一原理:
較之Tier III或Tier IV拓撲,一個Tier I或Tier II的拓撲相對便宜,但同時也提供了較少的可靠性和正常運行時間。
解決方案:當涉及到選擇一款電力系統的拓撲結構時,并沒有唯一正確的答案。企業組織應將他們的特殊業務情況和需求與其電力系統的拓撲結構相匹配,假設多個備份站點是可用的,那么用戶如果偶爾會遇到幾秒鐘的延遲的話,他們不太可能會過多抱怨。然而,如若是在華爾街,哪怕僅僅幾秒鐘的延遲所可能導致的損失則也是以數百萬美元計算的。因此,一處托管了金融交易應用程序的數據中心,選擇采用一個Tier IV拓撲結構將是明智的。
8、服務器是不能夠斷電的,機房是如何保證電力不中斷的?
簡單的來說,要保證電力不中斷采取的有效辦法是多路電力系統并聯,一條中斷,另一條則立即啟動,實際上因為服務器對電力的持續性要求很高,所以不管是哪一個機房在應對這個問題的時候都是很謹慎的。比如成都的西信中心,其IDC機房大樓采用4路獨立不同變電站市電輸入,并配備24臺2000KW柴油發電機和3臺3000KW燃氣輪發電機,總輸出達5.9萬KW。斷電后持續1小時以上的UPS系統,電力可用性達到99.99%;年計劃維護斷電時間累計不超過30分鐘,保證每個機柜從不同配電柜引電接入實現雙路供電。
像今年夏天這種情況,中國超過1/3的地區都處在持續高溫天氣之下,電力的需求大量提升,市電隨時都有可能中斷?;蛘呤怯龅搅撕闉?、地震之類的自然災害,如果機房的電力系統全部來自市電,仍然會存在電力中斷的風險。所以一家好的IDC機房會配備自己的發電設備,以應對不時之需。
運維一處大型的、散熱量大且復雜的數據中心的可用性比以往任何時候都更為困難,也更具重要的戰略性意義。特別是考慮到當前的全球經濟一體化,可持續發展的壓力和普遍的人口老齡化所導致的勞動力減少的大背景之下。企業組織已經利用了各種技術和流程,以確保關鍵任務的IT 系統能夠獲得清潔,可靠的電力資源供應。
如果您想了解更多關于一體化機柜的信息,或者您有任何疑問,請致電:400-030-5510。邁世為您提供24小時在線客戶服務,我們將竭誠為您服務! 同時,邁世是中國 機房監控 解決方案供應商與服務商,可以為您提供更多的解決方案。
@本文轉載于網絡
智慧機房在線體驗
400電話
微信掃一掃