隨著信息化﹑數字化技術的持續發展,數據中心機房成為維持各單位日常業務正常運行的一部分。氣象數據中心機房的動力環境直接影響到機房內各項工作的開展,因此只有保證氣象數據中心機房能為各運行設備提供一個安全、穩定的運行環境,才能確保日常工作有條不紊地進行[1]。動力環境中存在著各種各樣的安全隱患問題,在一定程度下會干擾到氣象通信數據的上傳、處理和存儲,因此需要做好實時監控。在傳統的氣象數據中心機房監控工作中,調度人員與各機房管理人員主要通過電話方式來溝通,這種溝通方式缺乏靈活性,也無法讓管理人員詳細掌握信息,再加上一些管理人員存在工作態度懶散、管理意識薄弱的情況,導致氣象數據中心機房的動力環境管理不當,影響到數據的通信工作。同時,一些通信機房設置的地區也比較偏遠,不利于機房管理人員看守并及時排除設備故障。所以,為了解決在以往監控工作中出現的問題,讓機房管理人員能夠第一時間獲知機房內的動力和環境設備處于異常的狀況,智能化的動力環境監控系統應運而生[2]。
1動力環境監控的意義
動力環境監控系統是一套能夠集中、高效地管理監控機房的技術手段。建設動力環境監控系統,在一方面不僅能夠保證機房管理人員及時獲取到機房狀態信息,盡快消除其動力環境中的不利因素,避免了各運行設備出現故障,為機房動力設備運行的穩定性及機房環境的安全性提供有力保障。另一方面動力環境監控系統具備監控靈活、全面的優點,能夠遠程監控并調整機房狀態,充分節省了人力資源,實現了機房的智能化值守。動力環境監控系統結合了多項先進技術,在實時監測動力環境的同時還能收集歷史數據和預警數據并集中分析,根據分析結果來把控環境的穩定性,對整個計算機系統的正常運作起著至關重要的作用[3]。
2動力環境監控系統組成
動力環境監控系統主要實現對機房內各種動力和環境設備進行監控、對機房突發狀況及時告警和對設備數據的查詢、生成報表等功能。通過將所有功能集中到一個統一的監控管理平臺,使機房相關管理人員能夠更加高效地管理和維護氣象數據中心機房,不僅提高了管理人員對系統設備的管理水平以及應對突發安全事件的快速反應能力,而且也減輕了他們的工作強度,節省大量的人力成本[4]。如圖1所示,動力環境監控系統主要由設備監控、數據處理、報警管理、統計報表和系統設置等5個模塊組成。
圖1動力環境監控系統組成圖
2.1設備監控
設備監控模塊的主要作用是采集被監控設備的運行狀態與運行參數信息,并將信息傳輸到機房監控主機進行數據處理,*后經由機房監控主機將數據通過網絡傳送到監控管理服務器。監控的對象包含了機房的溫濕度、消防狀態、漏水感應、配電、UPS和空調[5-6]。
2.1.1溫濕度監控
機房的溫濕度監控主要通過在機房服務器機柜等位置上安裝溫濕度傳感器,以此來掌握溫濕度的變化情況[7]。監控管理服務器接收來自溫濕度傳感器回傳的數值,并判斷此時機房的溫濕度是否在設定范圍。若溫濕度值超出了設定值,監控管理平臺會做出相應的提醒,并遠程自動開啟機房內的普通空調調整室內溫濕度。
2.1.2消防監控
機房的消防狀態采用的是接收煙霧傳感器的輸出信號來實時監控。當內部煙霧過多時,監控管理平臺會自動發出警報,以防止火災事故的出現。
2.1.3漏水感應
主要針對機房范圍內比如窗戶以及空調附近等容易漏水的位置開展監測。若感應到有漏水情況的發生也會作出實時警報。針對于漏水監測功能的動態系統還分為了定位與不定位兩種類型,定位類型即是指通過監測可判斷漏水情況出現的具體位置,不定位類型則是只能提醒機房有出現漏水,無法獲取位置,在該項監測中,系統的控制器與傳感端共同作用,一旦發生漏水就會立即將信號傳輸到監控管理服務器。
2.1.4配電監控
機房的配電監控主要包括兩方面:市電監測和精密配電監測。機房配電柜市電進線總線的供電質量直接關系到機房內設備的安全,因此市電監測不僅實時監測供配電系統的供電狀態是否良好,同時也會監測市電質量,具體可監測到的參數包括電壓值、電流值、有功功率、無功功率、有功電能、無功電能以及頻率等,切實保證這些電力參數處于合理范圍,若參數異常監控管理平臺也會做出相應的告警。
精密配電設施包括智能電表、配電柜、電源分配單元 (PowerDistributionUnit,PDU)以及列頭柜等等,在采用動力環境監控系統監測時,可以對這些精密配電設施進行重要數據采集,包括其主路的各配電信息以及支路的電流值與電壓值,保證各項電路運行的穩定性,若出現異常會發出告警。
2.1.5 UPS監控
不間斷電源(UninterruptiblePowerSystem,UPS)是機房內電力設備系統能夠正常工作的根基。對UPS進行實時監測,一是對UPS的逆變器、整流器、旁路、電池總電壓以及負載等進行參數監測,從而監視其運行情況;二是根據預先設定的參數值的范圍來開展檢測工作,若是出現參數值越限則判斷為UPS發生故障,監控管理平臺會發出告警,相應的告警情況也會被自動記錄;三是對監測情況的記錄會自動生成曲線,可以更加直觀地看出運行各參數變化情況,通過與歷史曲線進行對比來獲得更多信息,進一步方便管理UPS[8-9]。
2.1.6空調監控
數據中心機房中部署的空調有精密空調和普通空調兩種。普通空調主要用于調節機房溫濕度。根據區域內的溫濕度情況對普通空調開展遠程開關調控,該項監測功能的實現主要基于JZ-IEM系列監控主機設施以及相應的空調控制接口,同時,控制的實現還需使用外接紅外控制器。
精密空調是有別于普通空調的精密設備,在監控方面主要是實時監測回風溫度和回風濕度等空調參數,以及壓縮機、制冷器、加熱器和加濕器等的工作狀態。此外,還會對組件的過熱、風扇過載以及濾網堵塞等情況開展監控,保持精密空調的穩定運行。
2.2數據處理
數據處理模塊由監控主機完成。監控主機作為被監控設備和監控管理服務器之間的中繼站,承擔著兩項工作任務:一是按照系統的業務需求將收集到的設備數據信息進行匯聚、加工、運算、存儲等處理,比如通過采集某區域多個溫濕度傳感器的數值,計算出這個區域溫濕度的平均值和*大值。根據數據處理需求,制定合理的數據計算規則、復雜事件處理規則;二是將數據信息繼續傳輸給監控管理服務器。
2.3報警管理
監控管理服務器在整個動力環境監控系統中有著*高指揮的作用。在監控管理服務器上安裝基于集中監控管理平臺軟件,并將各種被監控設備的IP地址配置到這個集中監控管理平臺中,可以用來查詢數據中心機房內全部設備的工作狀態和運行參數。系統根據被采集的監控設備參數來判斷設備是否處于故障。若監控設備的參數超出系統設定的閾值,集中監控管理平臺會發出告警,并自動事先在系統設置及時提醒機房管理人員存在異常情況。系統設有一般告警、重要告警和緊急告警3個告警級別,當有多件告警時間發生時,系統會按照告警等級的嚴重程度依次排隊進行處理。此外,當系統有告警發生時會生成告警記錄,內容包括告警出現的時間以及結束時間、告警內容、告警級別等,并能保存*近1年內的告警記錄信息用于查詢和數據分析。
2.4統計報表
統計報表模塊分為兩部分:統計功能主要用于查詢告警記錄、設備監控數據等內容。報表管理功能是根據用戶需求將統計功能中查詢到的數據進行處理,用表格或者曲線的形式生成如告警統計報表、操作統計報表、歷史統計報表等多種報表用于機房故障信息的分析,加強機房運行可靠性和穩定性。
2.5系統設置
系統設置功能模塊由常用設置、個性化配置和更新日志組成。常用設置包括設備的管理、用戶權限管理和系統的配置。個性化配置包括監控管理平臺界面設置、平臺告警提示時間間隔、告警語言提示間隔等。更新日志記錄用戶對監控管理系統的所有操作。
3在氣象數據中心機房中的應用—以福州市氣象局中心機房為例
福州市氣象局根據數據中心機房的現狀,在機房部署實施了動力環境監控系統。從目前該系統的使用情況來看,達到了能夠實時監控氣象數據中心機房運行狀態的效果,滿足了業務需求。
3.1監控平臺展示
用戶通過本地瀏覽器訪問,就會進入到登錄界面,這時只要配置下端口就可以正常進入動力環境監控管理平臺的主界面了,設備監控界面見圖3。點擊左邊樹狀圖節點可以進入對應樓層機房的監控界面進行查看,右上角的查看列表可以在每個區域的監測點和組態圖之間切換。當設備處于正常狀態時,節點顏色為藍色,當設備處于異常狀態時,節點顏色根據告警的嚴重程度發生不同變化。監控界面的右下角也會彈出告警信息提醒。
圖3設備監控界面
點擊告警信息提醒進入“消息中心"界面,該界面會詳細記錄告警設備編號、告警設備名稱、設備所屬類型、告警等級、告警發生時間和告警次數等信息,方便機房管理人員及時定位故障位置解決問題,見圖4。
圖4告警信息提醒
3.2測試結果及分析
福州市氣象局數據中心機房動力環境監控系統,自其運行以來,各項功能均能正常使用。軟件指標可靠,具有直觀形象易用的圖形用戶界面,方便相關人員操作。目前已有的統計記錄表明:該動力環境監控系統系統能提供及時、準確的監測和告警信息。系統能根據先前制定的各種規則,將監測到的告警信息及時發送給相關的業務值班人員,發送的告警信息與實際情況相符,尚未出現信息的錯報、漏報。生成的告警記錄詳細具體,涵蓋了告警出現的時間、告警原因及對告警處理過程等內容,為后續分析、處理機房異常狀況的匯總工作提供了可靠的數據。該氣象數據中心機房的動力環境監控系統具備準確的告警功能、詳細的分析處理功能,多維的提示功能,使氣象保障業務值班人員無需通過以往例行的巡查監視的方式,就能夠得到準確的機房環境、動力設備運行狀態信息,當機房系統設備運行存在異常時,也能及時收到報警信息并盡早處理。氣象數據中心機房的運行維護水平更加高效智能,逐步走向真正意義上的“無人值班"[10]。
4安科瑞動環監控系統介紹設備選型
4.1軟件介紹
通過數據中心動環監控系統,實現了對數據中心的門禁狀態、水浸狀態,煙霧狀態,視頻狀態,環境狀態,高低壓配電狀態,設備運行狀態進行實時監測,并進行實時報警,保障數據中心正常運行,避免運行環境的失控導致配電設備運行故障,保證維護人員安全,延長設備使用壽命,減少配電室粗放式管理導致成本過高。同時實現動環監控并對各用能耗能進行能效分析,幫助用戶實現用能效率的優化。
系統功能
. 展示當前數據中心總能耗,IT能耗,空調能耗,及其他能耗并且計算出當前數據中心實時PUE值,通過儀表盤形式直觀展示。
. 選擇查看數據中心的中低壓配電系統主接線圖,并在一次圖顯示配電系統當前遙測、遙信數據和狀態。實時監測各配電柜的電壓、電流等電力參數,變電站的溫濕度、煙感、水浸、門禁等環境情況。
. 電氣接點溫度實時監測,斷路器觸頭、觸臂、母排和線纜連接等位置安裝無線測溫傳感器監測接點溫度,便于提前發現溫度異常導致的事故。
. 監測各變壓器各項參數,包括負載率、頻率、功率因數、三相不平衡度等,并且顯示歷時曲線圖,數據實時變化。
. 電能質量在線監測,可以監測電流和電壓諧波畸變率、電壓暫升暫降暫中斷等暫態事件記錄、ITIC容忍曲線等
. 系統采集UPS輸入、輸出端和旁路三相電壓、電流、有功功率、功率因數頻率,同時監測UPS溫度、蓄電池電壓、當前負載下的剩余時間等數據。
. 展示單體電池電壓、內阻和溫度,預測電池帶載時剩余時間,每節電池數據均可以設置異常報警,及時發現蓄電池異常。
. 展示精密配電柜內進線和饋線回路電氣參數,包括電流電壓功率電能以及開關狀態,并可以對數據進行報警設置和分級,數據取自精密配電柜測量模塊。
. 展示智能小母線的始端箱和插接箱電氣參數,包括電流電壓、開關狀態、插接點溫度,并對數據進行報警設置和分級。
. 通過平面圖顯示數據中心能源分布,設備分布情況,并顯示設備能耗數據,點擊平面圖上設備可以進入具體設備監控界面。
. 實時顯示當前數據中心PUE值以及歷史PUE曲線。并且顯示各分項用能的用能情況及用能排行。監測各變壓器運行及負載情況,給出本月變壓器輸出電能排行。
. 顯示電能消耗日/月/年報表,并可對具體回路選擇曲線圖、餅圖進行展示。對數據中心用電數據進行同比、環比分析比較,查看用電趨勢。
. 監測精密空調的回風溫濕度,出回水溫度,并可以設定精密空調的溫濕度,達到更好的控制效果。
. 監測數據中心溫濕度、開關門、水浸、煙霧、噪聲、氣體濃度狀態等參數。曲線圖直觀明了,同時支持歷史數據查詢
. 通過列表顯示各類報警事件數量,通過柱狀圖顯示逐日報警數量,提供報警總數以及增長趨勢。
. 維管理功能,可針對數據中心各主要設備進行巡檢派工,消缺,搶修等維護工作。
4.2動環監控系統設備選型
5總結
綜上所述,動力環境監控系統在氣象數據中心機房中的應用功能包括:(1)對機房動力環境設備的運行狀態和參數進行了實時監測;(2)具備智能報警功能,可以使得管理人員對于及時獲知機房發生的異常信息;(3)能夠查詢當前和歷史時間下機房動力環境設備的參數數據以及告警記錄,通過生成報表來對比不同時間段數據發生的變化,為機房管理人員分析設備故障原因提供了便利,提高了機房運行的穩定性。總之,動力環境監控系統是一種對動力環境進行實時監測并調節控制的機制,在氣象數據中心機房中具有較高的應用價值。
【參考文獻】
【1】黃恒,劉成浩,王彥明,等.通信機房動力環境監控系統應用探究[J].現代信息科技,2020,4(2):90-91.
【2】黃恒,劉成浩,王彥明,等.通信機房動力環境監控系統應用探究[J].現代信息科技,2020,4(2):90-91
【3】房 明,陳建云,智能化動力環境監控系統在氣象數據中心機房的應用
【4】安科瑞企業微電網設計與應用手冊2022.5版