色www,五月婷婷深爱五月,午夜国产一级片,色噜噜综合,国产大胸无码视频,清纯美女被操黄网站在线观看,波多野结衣av高清一区二区三区

機房應急預案

時間:2025-03-20 10:04:20 應急預案 我要投稿

【熱】機房應急預案15篇

  在日常生活或是工作學習中,難免會突發(fā)一些事故,為了避免事情往更壞的方向發(fā)展,很有必要提前準備一份具體、詳細、針對性強的應急預案。那么應急預案應該怎么編制才合適呢?下面是小編整理的機房應急預案,歡迎閱讀,希望大家能夠喜歡。

【熱】機房應急預案15篇

機房應急預案1

  機房是我單位的重要場所,重要儀器、設備相對集中,一旦發(fā)生事故,會造成嚴重后果 。為此特制定本應急預案。

  一、觸電

 。1) 一旦發(fā)生觸電事故,應迅速安全切斷電源,切忌直接接觸觸電者。

 。2) 即刻撥打緊急電話120并通知相關領導,同時開展現(xiàn)場應急救護 。

  二、火災

  1、報警程序:

  即刻通知領導及相關部門,根據(jù)火情大小如需報警立即就近用電話或手機報告消防中心(電話119).。

  2、組織實施:

  機房管理員一旦發(fā)現(xiàn)火情后,應即刻切斷電源,并使用滅火器撲救起火設備。

  三、空調漏水

  若空調系統(tǒng)出現(xiàn)滲漏水,應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,同時臨時用電扇進行降溫。

  四、設備發(fā)生被盜或人為損害事件

 。 1)發(fā)生設備被盜或人為損害設備情況時,使用者或管理者應立即報告中心負責人,同時保護好現(xiàn)場。

 。 2)中心負責人接報后,通知保衛(wèi)處,一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。

  ( 3)當事人應當積極配合公安部門進行調查, 并將有關情況向領導匯報。

  五、機房停電

 。1)接到長時間停電通知后,應及時發(fā)布相關信息,部署應對具體措施。

 。2)如遇臨時停電,且停電時間在3小時之內,管理員要檢查UPS是否正常工作,以確保機房設備的正常運行。。

  六、網(wǎng)絡故障

 。1)發(fā)生通信線路中斷、路由故障、流量異常等故障后,網(wǎng)絡管理員應及時查清通信網(wǎng)絡故障位置,隔離故障區(qū)域,組織相關技術人員檢測故障區(qū)域,逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉。

  (2) 事態(tài)或后果嚴重的,應及時報告領導并請求協(xié)助解決。

  七、不良信息和病毒事件

  (1)發(fā)現(xiàn)不良信息或網(wǎng)絡病毒時,管理員應立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡病毒傳播,并報告。

 。2)中心負責技術人員應采取隔離網(wǎng)絡等措施,及時殺毒或清除不良信息,并追查不良信息來源。

  (3)事態(tài)或后果嚴重的',應及時報告相關領導以及相關部門。

  八、服務器軟件系統(tǒng)故障

 。1)發(fā)生服務器軟件系統(tǒng)故障后,在確認安全的情況下,重新啟動故障服務器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復;

  (2)若重啟失敗,應立即安排備份服務器啟用,并請求技術人員支援,作好技術處理。

  九、注意事項:

  第一、機房管理員要加強日常監(jiān)控,及時處理、消除及上報安全隱患。

  第二、備齊安全相關裝備。

  第三、及時做好備份。

機房應急預案2

  一、為認真貫徹落實《國務院關于特大安全事故行政責任追究的規(guī)定》,積極提高我公司重點要害部位特大安全事故應急處理能力,努力減少各類特大安全事故所造成的損失,消除火災事故的隱患,保障公司財產(chǎn)和員工的生命安全,特制定本預案。

  二、本預案針對我公司通信機房的火災而制定。

  移動通信機房滅火流程如下:

 。ㄒ唬┲蛋嗳藛T發(fā)現(xiàn)機房火情(包括監(jiān)控中心人員)要立即到現(xiàn)場查看。

 。ǘ┤绻莻別電路盤著火,應拔出著火的電路盤,用1211或二氧化碳滅火器將火撲滅。

  (三)某機柜幾塊電路盤及電纜著火,應立即拔出著火的電路盤,用1211或二氧化碳滅火器噴射滅火劑將火撲滅。

 。ㄋ模┤绻麢C房的機架機柜著火,值班人員無力自滅自救時,監(jiān)控中心應切斷機架機柜電源或樓層電源,關閉空調,嚴禁開窗,及時向公司安全生產(chǎn)管理領導小組報告。

 。ㄎ澹┕景踩a(chǎn)管理領導小組指揮機關義務消防隊隊員進行滅火,組織值班人員立即撤離現(xiàn)場,封閉門窗,按下區(qū)域自動滅火按鈕滅火,同時撥打119報警,大聲呼救,報告公司主管領導或安保值班室,監(jiān)控室廣播火警。

 。┰谙狸牭竭_后,應積極配合,簡明扼要說明著

  火位置,火勢情況和已采取的補救措施。

 。ㄆ撸┯1211或二氧化碳滅火器噴射滅火劑能把火撲滅的`,應配合消防隊保護現(xiàn)場和消除隱患,防止再次著火。

 。ò耍┯1211或二氧化碳滅火器不能把火撲滅時,為防止煙熏引起人員中毒,應組織人員有序疏散,使用相應的滅火器材滅火,盡快將火撲滅。

  (九)應保護好現(xiàn)場,按照事故調查處理辦法執(zhí)行。

  (十)火災報警電話: 119

  三、本預案應注意的特別事項

  1、當發(fā)生火災情況,進行處理并保證人身安全的同時, 根據(jù)設備的重要性進行相應的搶救措施,保證重要設備,特別是直通電話,以及與冀北、華北相應數(shù)據(jù)的上傳,保證通道暢通。

  2、搶救完主要設備,在進行次要的設備搶修,待事故處理完畢后,進行相應的實驗,保證設備的運行性,并進行設備的可行性分析。

機房應急預案3

  計算機機房作為所有業(yè)務、應用系統(tǒng)的核心,一旦計算機機房發(fā)生突發(fā)事件,將對單位的數(shù)據(jù)等造成嚴重損失。為此,特制訂機房突發(fā)事件應急預案。

  一、機房突發(fā)事件定義

  機房突發(fā)事件是指由特殊原因引發(fā)威脅機房安全并且不能通過日常維護手段解決的事件。比如,火災、漏電、斷電等非人為或者人為的事件,重大突發(fā)事件發(fā)生后,應立即組織現(xiàn)場救護或臨時處置,控制事態(tài)發(fā)展,最大限度地減少損失和影響。

  二、機構和職責

  機房突發(fā)事件應急小組單位領導:

  機房突發(fā)事件應急小組部門領導:

  機房突發(fā)事件應急小組成員:

  各責任人職責:

  應急小組單位領導:負責單位層面及范圍內的決策與領導。

  應急小組部門領導:負責部門層面及范圍內的決策與領導并組織實施突發(fā)事件預案。

  應急小組成員:按崗位職責分工,聽從指揮,服從安排全力以赴解決突發(fā)事件。

  三、突發(fā)事件報警

  應區(qū)分原因在第一時間報警。

  自然災害(火災),撥打火警電話:119人為事件(非法盜取、攻擊等)撥打匪警電話:110人員傷亡,撥打急救電話:120其他時間(斷電等),撥打值班電話:

  四、突發(fā)事件處理

  突發(fā)事件發(fā)生后,應立即啟動應急預案。

  1、失火、漏水:

  視事件的緊急程度,應急小組成員要在領導的指揮下,有組織、有順序的`備份數(shù)據(jù)、關閉服務器的電源;組織人力轉移設備。如果自動設備未能正常啟動,應在組長安排下首先切斷機房的水、電路,組織人力采用滅火器等滅火設備人工滅火,同時要在第一時間報警。

  2、斷電:

  在城電斷電的情況下,機房的備用電力將發(fā)揮作用,電力供應最長可持續(xù)4小時。由于機房空調沒有備用電力,如確認是供電局斷電,應立即聯(lián)系發(fā)電機發(fā)電;如果不是供電局斷電,而是由于辦公樓電力線路故障引起的斷電,應立即通知電工查找原因,盡快排出故障。如果無法盡快恢復供電,在電力延續(xù)期間,應盡快結束未執(zhí)行完畢的任務,如無法完成需及時備份數(shù)據(jù),同時應關閉所有非必須服務器,盡量不讓機房溫度過高,保證網(wǎng)絡設備的正常運行,以便保障集中在單位的應用系統(tǒng)能正常使用。

  五、恢復生產(chǎn)

  突發(fā)事件結束后,有關人員應首先對現(xiàn)場進行清理,匯總損失情況并上報各級領導。緊急召開專項會議分析損失情況,制定數(shù)據(jù)恢復計劃。設備損失的要及時更換設備,保證恢復計劃的順利進行。

  恢復生產(chǎn)后,系統(tǒng)管理員應對各系統(tǒng)進行自查,上報書面報告,并由部門領導匯總后上報單位領導。

  機房管理員在恢復生產(chǎn)后要及時檢查各項維持系統(tǒng),如UPS、滅火器、漏水、漏電探測器等是否正常運行,應及時更換受損的元器件,補充滅火器的填充物。

機房應急預案4

  沙溝中學實施營養(yǎng)午餐突發(fā)斷水斷電等意外事故處理應急預案水、電是實施營養(yǎng)午餐改善計劃學校食堂正常供餐必備的最基本的條件,是食品安全工作的重要組成部分,也是保障師生正常生活的重要基礎。斷水斷電等意外事故在學校時有發(fā)生,為進一步加強學校食堂水、電等設施的管理,保障學校斷水斷電等意外事故發(fā)生時能正常為學生提供圖紙等的營養(yǎng)午餐,維護學校正常的教育教學秩序,特制定本預案

  一、組織機構

 。ㄒ唬┏闪W校突發(fā)斷水斷電等意外事故應急成立領導小組。

  組長:王鵬程

  副組長:馬紅治

  馬志銳

  組員:馬強

  呂宗仁

  王繼祖

  陸巖

  馬萬喜

  各班主任

  指揮部的工作職責是:

 。1)啟動學校斷水斷電等意外事故處理應急預案。

 。2)領導、組織、協(xié)調事故應急處理工作。

  (3)負責事故處理事項的決策。

 。4)負責上報與事故相關的重要信息。

 。5)審批學校應急處理工作報告。

  二、常規(guī)管理

 。ㄒ唬W校組織相關人員定期和吧不定期深入學校對學?赡軘嗨當嚯姷纫馔馐录碾[患,即使做查漏補缺,做到早發(fā)現(xiàn)、早報告、早治理,不能因為人為因素斷水斷電而停止正常營養(yǎng)午餐。

 。ǘW校要與當?shù)卣、水保站、農電站等相關部門保持聯(lián)系,協(xié)調學校的用水和用電工作。

 。ㄈ⒂盟o張或缺水學校,要想辦法做好學校用水的儲蓄工作,并邀請相關部門對學校用水質量檢測,確保水質量好,無安全隱患。

 。ㄋ模⒆龊脤W校食堂用電設施的改造工程,指定專人經(jīng)常對學校食堂用電設施進行檢修,維護。

 。ㄎ澹、對卻因客觀原因二造成的斷水斷電等意外事故時應立即啟動該預案。

  三、建立報告機制

  1、對學校發(fā)生臨時斷水斷電等意外事故是學校不能對學生實施午餐時,學校從業(yè)人員向管理人員報告,管理人員向校長報告,校長協(xié)調有關人員檢查檢修,對于用電設施必須有專業(yè)人員進行檢修,確保短時間內供水供電。

  2、對學校發(fā)生長時斷水斷電等意外事故時,學校從業(yè)人員向管理人員報告,有管理人員檢查檢修,同時上報縣意外事故應急處理協(xié)調領導小組。

  四、事件處理

  1、各級領導小組負責人接到報告后,及時組織相關人員趕赴學校開展事故處理工作

  2、學校應及時對學生做好解釋說明工作,同時采取科學合理的辦法通過各種途徑解決學生營養(yǎng)午餐

  3、學校迅速與家長取得聯(lián)系,通過告示等形式給家長做好解釋工作,去的家長的'諒解,保證廣大師生及家長在事故發(fā)生和過程中的知情權,嚴防事態(tài)擴大給學校教育工作造成不良影響。

  4、協(xié)調各方面力量做好學校穩(wěn)定工作,保障學校正常的教育教學秩序

  5、學校要及早購置手搖鼓風機等應急設備,在學校斷電時能立即啟用。

  6、主動和有關部門聯(lián)系,及時購買等價等值、衛(wèi)生、營養(yǎng)、可口的熟食品,如牛奶、面包等,及時為學生供應午餐。

  7、斷水斷電事故處理結束,要認真總結分析事故發(fā)生原因,提出改進意見,完成處置總結報告,報送縣營養(yǎng)辦。

  五、責任追究

  對斷水斷電突發(fā)公共事件的應急處置工作中實行領導責任制和責任追究。對有突出表現(xiàn)的個人予以鼓勵和表彰;對負有直接責任個人依據(jù)有關法規(guī)和規(guī)定給予行政處分;;對處理不當,貽誤時機,造成惡劣影響的直接責任人,要嚴肅追究責任。

  六、本預案由學校突發(fā)斷水斷電等意外事故一見處理工作領導小組負責解釋。

機房應急預案5

  信息中心機房是就業(yè)中心開展各項工作的重要保障,也是重點消防部位。為了應對消防事故的發(fā)生,特制定以下應急預案:

  一、機房消防安全堅持“標本兼治、綜合治理,防消結合、預防為主”的基本原則,堅持嚴防死守,確保萬無一失。

  二、加強單位職工的安全教育,全面提高應對火災的'能力和心理素質,把損失和危害減少到最低程度。

  三、加強領導,健全機構,成立機房消防安全責任小組。 組 長:

  副組長:

  責任人:當班人員、信息中心工作人員

  四、正確處置消防事件:

  1、發(fā)現(xiàn)火情后,迅速切斷電源,利用就近滅火器滅火;如不能及時控制、撲滅火災,立即啟動應急預案,以最快的方式向上級報告,并視火情立即撥打119報警;

  2、接到火警后,組長、副組長及工作人員應在最短時間內迅速趕赴現(xiàn)場進行撲救;

  3、及時搶救重要設備,并引導人員疏散自救。

  4、一旦有人受傷應及時實施搶救,并及時撥打120請求救護支援;協(xié)助醫(yī)護人員對受傷人員進行緊急救護等;

  5、火警解除后,及時保護現(xiàn)場,看護設備,防止次生事故發(fā)生,并及時向上級匯報火情和損失,配合相關人員進行事故調查。

  五、注意事項

  1、避免人身傷害,撲救要在確保人員不受傷害的前提下進行。

  2、火災第一發(fā)現(xiàn)人應查明原因,如是電源引起,應立即切斷電源。

  3、逃生時應盡量采取保護措施,如用濕毛巾捂住口鼻,用濕衣服包裏身體。同時啟用消防應急通道,嚴禁擁擠、阻塞和跳樓、跳窗等事件發(fā)生。

  4、堅持預防為主,堅持安全值班巡查制度,嚴守機房消防安全管理制度,保持通信工具暢通,發(fā)現(xiàn)隱患及時上報處理。

  6、認真分析事故原因,總結經(jīng)驗教訓,虛心接受有關部門的檢查、指導、批評和教育。

機房應急預案6

  為確保辦公室機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責明確運轉有序、反應迅速處置有力的機房安全體系的目標,特制定本預案。

  一、機房日常維護

  1、建立健全機房管理制度

 。1)在正常工作日內,信息技術人員負責對機房進行監(jiān)控,主要職責是:巡視網(wǎng)絡設備及系統(tǒng)的運行情況,發(fā)生異常情況及時處理,消除網(wǎng)絡故障隱患。

 。2)節(jié)假日期間信息技術人員輪流值班,負責處理有關異常情況。

 。3)機房采取來人來訪登記制度,未經(jīng)允許,無關人員不得進入機房區(qū)域。

  2、機房內嚴格采取防雷、防火、防塵、防靜電等措施以及機房入口處24小時監(jiān)控錄像等措施。

  3、認真做好數(shù)據(jù)備份工作,定期做一次數(shù)據(jù)庫完全備份,每月檢查服務器運行和備份情況。

  4、信息技術人員對機房的主要網(wǎng)絡設備(路由器、主干交換機等)進行工作時間內全程監(jiān)控,發(fā)現(xiàn)異常情況應及時進行處理,確保辦公室網(wǎng)絡的正常運行。

  二、機房突發(fā)事件應急處置方案

  1、電源系統(tǒng)應急預案

 。1)定期檢查機房供電設備的運行狀況和電路線纜器材情況,當發(fā)生下列突發(fā)事件時,按照以下方案進行處置:

  (2)當機房發(fā)生市電供電突然停電或是電源異常時。檢查不間斷電源的電池可供電時間,確保設備正常運行,如遇到突然斷電,應及時將空調等設備及時斷電,預防突然來電時瞬間電流過大導致設備損壞等現(xiàn)象。

  (3)當確定停電原因是在本身供電系統(tǒng)范圍內,立即匯報給負責領導,并及時聯(lián)系相關維護人員達到現(xiàn)場檢修。

 。4)恢復供電后,嚴格按照操作程序逐步恢復機房設備,以防瞬間電流過大造成設備損壞。

  2、網(wǎng)絡和服務器絡系統(tǒng)應急預案

 。1)發(fā)生網(wǎng)絡故障時,首先檢查機房設備情況,確定網(wǎng)絡故障的原因,然后聯(lián)系網(wǎng)絡維護人員,及時處理和排除故障。

 。2)當確認原因為短時間無法恢復,應該及時向負責領導匯報,然后再聯(lián)系維護人員,及時處理故障。

  (3)當人為或病毒破壞的故障發(fā)生時,具體按以下順序進行:判斷破壞的'來源及性質,斷開影響安全與穩(wěn)定的信息網(wǎng)絡設備,斷開與破壞來源的物理網(wǎng)絡連接,然后再聯(lián)系維護人員,及時處理故障。

 。4)發(fā)生服務器系統(tǒng)故障后,應立即向相關領導匯報情況,同時安排人員將故障服務器脫離網(wǎng)絡,保存系統(tǒng)狀態(tài)不變,保護原始數(shù)據(jù)。

  在確認安全的情況下,重新啟動故障服務系統(tǒng):若重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復;若重啟失敗,立即 聯(lián)系相關維護人員,請求技術支持,做好技術處理。

  處置結束后,技術人員應將處理過程記錄下來,以方便日后對此問題的處理。

  3、消防和防雷應急預案

  (1)上班工作時間發(fā)生火警,還在機房工作的人員應及時緊急撤離,并立刻撥打119報警。在確保自身安全的情況下,應盡量使用滅火器進行滅火,減少電子設備的損壞。同時采取關閉電源總閘等措施,盡量減少可能造成的損失和破壞。

 。2)非工作時間或節(jié)假日休息時間值班人員發(fā)現(xiàn)火情后,要立刻撥打119報警,并立刻通知相關部門和領導,做好火災的處置工作。

  (3)火情結束之后,機房相關人員應全體趕赴現(xiàn)場,同時立即聯(lián)系相關網(wǎng)絡公司和設備相關廠家,及時評估事故損失情況,研討恢復網(wǎng)絡系統(tǒng)正常運行的最佳解決方案。

  (4)遇雷暴天氣或接上級部門雷暴氣象預警,應關閉所有服務器,切斷電源,暫停內部計算機網(wǎng)絡工作。雷暴天氣結束后,及時開通服務器,恢復內部計算機網(wǎng)絡工作。因雷擊造成的損失,應及時進行核實、報損,并將詳細情況向部門領導匯報。

  4、自然災害和盜搶應急預案

 。1)發(fā)生自然災害后,首先應該組織人員撤離現(xiàn)場。當確認災害不會造成人生傷害后,在回到機房檢查設備,立刻向上級領導匯報,并聯(lián)系相關網(wǎng)絡和設備廠家,積極做好災后恢復工作,確保在最短時間內

  恢復機房正常運行。

 。2)發(fā)生盜搶事件后,要保護好現(xiàn)場然后報警,并向上級領導匯報情況。待現(xiàn)場處理完畢后,要組織相關人員估計損毀情況,并聯(lián)系相關網(wǎng)絡和設備廠家,積極做好恢復工作。

機房應急預案7

  第一條:機房意外停電后,首先確定停電的范圍以及受影響的設備范圍。

  第二條:確認停電的范圍為本公司或本機房,應立即聯(lián)系工機科電話匯報。估算電力可能恢復的時間,并通知直接上級。

  第三條:如果確認停電的時間在1個小時內,可以在UPS正常供電的時間內,等到電力恢復。如果不能確認在2個小時內恢復供電,需及時到達現(xiàn)場。做好各設備的電源停電準備。在UPS供電達1.5個小時后,嚴格按操作手冊停掉存儲和各應用服務器的電源,最后停核心交換機和路由期。等待電力恢復,電力恢復供電后轉第七條執(zhí)行。如果確認停電的范圍僅在于本機房電源故障,立即匯報給機房電源維護負責人。

  第四條:機房維護負責人將掉電的電源柜總空開和分空開的狀態(tài)處于下電狀態(tài)。并向直接領導匯報,馬上聯(lián)系相關廠家,如有可能請廠家立即到現(xiàn)場支持。第五條:將掉電的所有的設備電源狀態(tài)處于下電狀態(tài),以防止電源柜加電對設備的.沖擊。

  第六條:等各廠家和相關的人員到齊后,商議設備恢復時因注意的事項,并形成相關文檔。

  第七條:電力室恢復供電后,先不要急于給電源柜加電,等待10—20分鐘后,再開始給電源柜加電,以防止供電不穩(wěn)或再次掉電。

  第八條:供電正常后,確定設備處于下電狀態(tài)后,打開電力柜的總控開。第九條:根據(jù)設備加電順序,啟動分項空開。第十條:設備加電順序,網(wǎng)絡交換類設備正常后再給磁盤陣列柜加電,存儲狀態(tài)檢查正常后,啟動主機(以上各設備務必按操作手冊的啟動順序上電)。第十一條:設備啟動正常后,開始啟動數(shù)據(jù)庫。第十二條:數(shù)據(jù)庫啟動正常后,開始啟動中間件服務器。第十三條:中間件服務器正常后,啟動應用程序。

  第十四條:機房設備進行全面點檢,確認所有設備運行和服務正常。

機房應急預案8

  一制定目的

  為應對醫(yī)院突發(fā)性大面積停電事故,迅速有序地組織和恢復供電,確保病人生命安全和減少財產(chǎn)損失,保證醫(yī)院用電暢通,促進事故應急工作的制度化和規(guī)范化,依據(jù)國家相關法律法規(guī),結合我院實際情況,制定本預案。

  二適用范圍

  本預案所稱“突發(fā)性大面積通電事故”(下稱“大面積停電事故”)是指因嚴重自然災害重要設施損壞或遭受破壞等原因造成突發(fā)性的'全院大面積電力系統(tǒng)安全防線失效,電網(wǎng)發(fā)生大面積瓦解或崩潰的事故。

  三應急原則

  大面積停電事故處理工作貫徹“預防為主,常備不懈”的方針,遵循“統(tǒng)一領導,完善機制,明確責任,加強合作,快速發(fā)應,措施果斷”的原則。

  四組織機構

  醫(yī)院成立大面積停電事故應急領導小組,下設應急搶修隊。

  1、醫(yī)院大面積停電事故應急領導小組組長:

  總經(jīng)理副組長:

  院長成員:

  人事行政部經(jīng)理后勤主管電維修工職責:

 。1)做好日常安全供電工作,落實安全生產(chǎn)責任制,防范大面積停電事故發(fā)生。

  (2)發(fā)生大面積停電事故時,及時做好停電事故應急工作,盡快恢復供電。

 。3)根據(jù)大面積停電事故嚴重程度,決定啟動和終止應急預案。

 。4)及時向上級報告事故情況并向社會公布。

 。5)必要時請求外力支援。

 。6)領導小組組長是履行本預案規(guī)定的第一責任人。成員單位應在領導小組的統(tǒng)一指揮下,各司其職,各負其責,通力合作,做好大面積停電事故時的社會綜合應急工作。

  2、應急搶修隊隊長:

  后勤主管成員:

  電維修工職責:

  發(fā)生事故時,組織人員實施救援行動;向指揮小組匯報事故情況,必要時向供電部門發(fā)出求援請求,事后總結應電路還是低壓電路。如果高壓電路出現(xiàn)故障,醫(yī)院電工立即導入備用電源,應及時與供電部門搶修班聯(lián)系,盡快恢復,保證用電;如果醫(yī)院抵押電路出現(xiàn)故障時,應快速查明原因,按照操作規(guī)定恢復電路。

 。ǘ┎块T科室應急程序

  1、各科室接到停電通知后,應該在允許情況下吧所有的及其電源切斷,待電路恢復正常后再投入使用。

  2、接到停電通知后,立即做好停電準備。如有搶救患者使用備用電源。

  3、突然停電后,立即尋找搶救患者及其運轉的動力方法,維持搶救工作,并開啟應急燈照明等。并應及時通知電工或總值班。

  4、危重患者手術中使用呼吸機的患者平時應在機旁備有簡易呼吸器,遇突然停電,醫(yī)護人員立即將呼吸機脫開,使用簡易呼吸器維持呼吸。使用電動吸氮的患者,用50ml注射器接吸氮管吸氮。

  5、如雙線均突然出現(xiàn)供電故障,院內發(fā)電機供電前,醫(yī)護人員則應首先保證病人搶救;護士應沉著鎮(zhèn)靜,上呼吸機者采用手抱球法,上監(jiān)護儀者采用人工測血壓脈搏,電動吸氮者則采用50毫升注射器接吸氮管抽吸等,嚴密觀察并請變化,其余工作人員則立即電話通知電工,人事行政部,并采用應急燈供照明。

  6、加強巡視病房,安撫患者,同時注意防火防盜。

  7、電梯遇到突然停電后,后勤人員要做好乘客思想工作,向外面打電話,用人工方法把所有乘客放出去。

  六保障措施

  1、電工日常應做好發(fā)電機的維護保養(yǎng)工作,保證發(fā)電機隨時投入使用。

  2、電工平時要掌握供電知識和操作規(guī)范,注意操作安全。

  3、臨床科室常規(guī)備有應急燈電筒等照明用物,定期檢查,保持完好狀態(tài)。

  4、后勤部門要組織進行應急停電演練,每年1-2次,通過演練,使大家熟悉掌握突發(fā)停電的應急處置程序,確保病人安全。電路還是低壓電路。如果高壓電路出現(xiàn)故障,醫(yī)院電工立即導入備用電源,應及時與供電部門搶修班聯(lián)系,盡快恢復,保證用電;如果醫(yī)院抵押電路出現(xiàn)故障時,應快速查明原因,按照操作規(guī)定恢復電路。

機房應急預案9

  第一條 機房突發(fā)事件

  包括網(wǎng)絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的`安全事件等等。 針對突發(fā)事件的預防措施如下:

  建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統(tǒng);加強防火、防盜意識。

  第二條 機房漏水應急預案如下:

  1、發(fā)生機房漏水時,第一目擊者應立即通知機房管理人員。

  2、若空調系統(tǒng)出現(xiàn)滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。

  3、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。

機房應急預案10

  網(wǎng)絡信息中心機房環(huán)境主要監(jiān)控目標對象為:電力供應、火情、空調異常。監(jiān)控對象表征為:UPS可監(jiān)控數(shù)據(jù)(包括輸入、輸出、負載等)、煙霧、環(huán)境溫濕度值。

  環(huán)境監(jiān)控報警根據(jù)影響范圍不同定為不同級別,予以不同處置,應急處置流程如下:

  一、 緊急告警

  (一) 機房煙霧告警

  1. 如消防系統(tǒng)已啟動,立即通知相關區(qū)域同志撤離機房。

  2. 如消防系統(tǒng)尚未啟動,立刻調出該場地視頻監(jiān)控,確認是否有火情。一旦確認火情,立即疏散,并確認消防系統(tǒng)能正確啟動。

  3. 火警必須在第一時間電話通知中心主任、相關機房安全責任人、辦公室主任和環(huán)境與設備工程師。

  4. 按消防相關程序處置。

  (二) UPS輸入掉電告警

  1. 立刻通知環(huán)境與設備工程師和相關機房負責人,環(huán)境與設備工程師即刻響應并處理,通知機房負責人電池放電情況。

  2. 相關機房負責人待命響應,根據(jù)需要按預定程序逐級安全關閉各類系統(tǒng)或設備,并通知相關部門及人員。

  3. 如影響中心關鍵業(yè)務,由機房負責人作出判斷,并立即通知業(yè)務所屬責任部門。

  (三) 機房地濕告警

  立刻通知相關機房負責人和環(huán)境與設備工程師,現(xiàn)場查看空調底下是否有水管爆裂漏水。

  備注:漏水事故影響不可輕忽,某些情況下會引起災難性事故,請務必關注。

  (四) UPS輸出故障

  1. 立刻通知環(huán)境與設備工程師和相關機房負責人,環(huán)境與設備工程師即刻響應并處理,通知機房負責人影響范圍。

  2. 相關機房負責人立即響應,如影響中心關鍵業(yè)務,由機房負責人作出判斷,并立即通知業(yè)務所屬責任部門。

  二、 重要告警

  (一) 監(jiān)控數(shù)據(jù)通信中斷告警

  發(fā)現(xiàn)監(jiān)控數(shù)據(jù)通信中斷告警,需要綜合查看,首先排查是否網(wǎng)絡原因,其次排查是否服務器原因。以下狀況考慮環(huán)境因素:

  如果同時有大面積的網(wǎng)絡故障和服務器故障,很可能是UPS輸出故障,立即通知環(huán)境與設備工程師、運行部負責人和系統(tǒng)部負責人。

  如果是單純的數(shù)據(jù)數(shù)據(jù)通信中斷,一般是監(jiān)控設備死機,在工作時間通知環(huán)境與設備工程師處理。

  1. 機房高溫告警

  立刻通知環(huán)境與設備工程師,如判斷空調已失效,則需到現(xiàn)場處置。

  備注:由于機柜上的溫濕度儀因熱通道和鐵架的.熱傳導作用使得感應溫度偏高很多,只能做參考。因此,如夜間發(fā)現(xiàn)高溫告警,可注意觀察,如有持續(xù)異常升溫則通知環(huán)境與設備工程師處理。

  2. 冷凍水高溫告警

  發(fā)現(xiàn)冷凍水高溫告警或空調進水高溫告警,即刻通知環(huán)境與設備工程師處理。

  3. 市電掉電告警

  工作時間,立刻通知環(huán)境與設備工程師處理。非工作時間,如發(fā)生UPS輸入掉電告警,按前述流程處置。

  三、 一般告警

  其他機房環(huán)境監(jiān)控告警,考慮都是設備故障或者部分功能異常,影響面有限,在工作時間通知環(huán)境與設備工程師處理。

機房應急預案11

  第一條 機房突發(fā)事件包括網(wǎng)絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發(fā)事件的預防措施如下: 建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統(tǒng);加強防火、防盜意識。

  第二條 機房漏水應急預案如下:

  1、發(fā)生機房漏水時,第一目擊者應立即通知機房管理人員。

  2、若空調系統(tǒng)出現(xiàn)滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。

  3、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。

  第三條 機房火災應急預案如下:

  1、完善機房環(huán)境,確保機房放置滅火器;禁止攜帶易燃易爆物品進入機房。

  2、機房管理人員應熟悉機房內部消防安全操作和規(guī)則,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火源。

  3、一旦發(fā)生火災,迅速切斷機房電源,避免災情的擴散,并迅速和保安部聯(lián)系必要時立即報火警。

  第四條 機房停電應急預案如下:

  1、接到停電通知后,應及時通過辦公系統(tǒng)、電話等發(fā)布相關信息,部署應對具體措施,要求在停電前停止業(yè)務、保存數(shù)據(jù)。

  2、機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時,UPS電源能自動供應服務器正常工作15分鐘以上,保證員工工作的'數(shù)據(jù)及時保存。

  第五條 通信網(wǎng)絡故障應急預案如下:

  1、發(fā)生通信線路中斷、流量異常等故障后,發(fā)現(xiàn)狀況的員工或部門領導應及時通知網(wǎng)絡管理員。 2、網(wǎng)絡管理員了解情況后,迅速組織檢測故障區(qū)域,并作相關故障處理,逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉。

  第六條 服務器故障應急預案如下:

  1、機房管理人員每日檢查機房內各服務器狀態(tài)。

  2、定期備份數(shù)據(jù)服務器數(shù)據(jù)。并將備份資料拷貝到移動設備。服務器出現(xiàn)嚴重硬件故障時啟用備用服務器以保障正常運轉。

機房應急預案12

  第一條 機房突發(fā)事件包括網(wǎng)絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發(fā)事件的'預防措施如下: 建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統(tǒng);加強防火、防盜意識。

  第二條 機房漏水應急預案如下:

  一、發(fā)生機房漏水時,第一目擊者應立即通知機房管理人員。

  二、若空調系統(tǒng)出現(xiàn)滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。

  三、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。

  第三條 機房火災應急預案如下:

  一、完善機房環(huán)境,確保機房放置滅火器;禁止攜帶易燃易爆物品進入機房。

  二、機房管理人員應熟悉機房內部消防安全操作和規(guī)則,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火源。

  三、一旦發(fā)生火災,迅速切斷機房電源,避免災情的擴散,并迅速和保安部聯(lián)系必要時立即報火警。

  第四條 機房停電應急預案如下:

  一、接到停電通知后,應及時通過辦公系統(tǒng)、電話等發(fā)布相關信息,部署應對具體措施,要求在停電前停止業(yè)務、保存數(shù)據(jù)。

  二、機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時,UPS電源能自動供應服務器正常工作15分鐘以上,保證員工工作的數(shù)據(jù)及時保存。

  第五條 通信網(wǎng)絡故障應急預案如下:

  一、發(fā)生通信線路中斷、流量異常等故障后,發(fā)現(xiàn)狀況的員工或部門領導應及時通知網(wǎng)絡管理員。 二、網(wǎng)絡管理員了解情況后,迅速組織檢測故障區(qū)域,并作相關故障處理,逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉。

  第六條 服務器故障應急預案如下:

  一、機房管理人員每日檢查機房內各服務器狀態(tài)。

  二、定期備份數(shù)據(jù)服務器數(shù)據(jù)。并將備份資料拷貝到移動設備。服務器出現(xiàn)嚴重硬件故障時啟用備用服務器以保障正常運轉。

機房應急預案13

  為了應對各種突發(fā)和緊急事件,特制訂以下方案。

  一、突發(fā)和緊急事件指自然因素或其它原因引起(或可能引起)基站財產(chǎn)安全或較多基站中斷的所有事件。

  二、啟動基站維護(緊急)組織實施方案的范圍:梅雨季節(jié)地勢低洼基站的防汛;雷電高峰期基站的動力搶修或搶險;大雪(暴雪)基站房屋及鐵塔的維護及應急搶修工作;臺風、地震前中后基站及鐵塔的維護;傳輸或MSC(BSC)故障造成基站大面積故障,故障恢復后基站網(wǎng)絡的測試。

  三、啟動基站維護(緊急)組織實施方案的條件:天氣和各種地質災害預報或由此可造成(或正在造成)基站的財產(chǎn)安全和網(wǎng)絡穩(wěn)定運行,網(wǎng)管統(tǒng)計發(fā)現(xiàn)大面積網(wǎng)絡故障時必須立即啟動基站維護(緊急)組織實施方案。

  四、對于由自然因素可能引起的基站及分布系統(tǒng)站點的財產(chǎn)安全和網(wǎng)絡穩(wěn)定運行,得知地質或天氣預報后,立即組織各代維項目部區(qū)和相關工程施工單位對所在地的站點進行預防性巡檢,對于各種隱患要求各項目部現(xiàn)場及時上報給我公司災害預防和處理應急領導小組和各地移動公司應急領導小組。

  五、我公司應急領導小組成員和各代維項目部所有維護人員在重大災害預防和搶險過程中的的移動電話必須24小時開機,必須無條件服從公司應急領導小組和代維項目經(jīng)理統(tǒng)一安排,若某項目出現(xiàn)人員不足的情況下,公司臨時從總部或異地抽調人員和車輛參加搶險;凡當?shù)匾苿庸舅犝军c不是我公司維的護站點出現(xiàn)重大險情后,我公司抗災任務又不重時,各項目部要主動向移動請纓。

  六、公司在每一次抗災救險活動結束后

  公司應急領導小組應對本次活動的成功經(jīng)驗和教訓進行總結,對表現(xiàn)優(yōu)秀的團隊或個人進行表彰,表現(xiàn)較差的團隊或個人進行處罰

  七、重大災害預防和搶險的人員組織機構:

  領導小組由總經(jīng)理,副總經(jīng)理,各部門經(jīng)理及地區(qū)經(jīng)理組成,總經(jīng)理為總指揮,各代維項目部也應成立相應成立相應的抗災救險領導小組。

  八、抗災救險人員安排:

  公司總部和各代維項目部應包括以下小組

  1、通信保障組:在發(fā)生險情時提供移動通信應急保障,負責實施應急通信的詳細方案、應急中所需的備品、備件、測試儀表、工具、技術資料的保管及預防性維護保障工作。

  2、物資調撥組:負責所有應急物資日常保管、定期檢查、更新以及應急時的.調撥和運送。

  3、搶險救災組:負責應急時的搶修和救災方案的實施

  九、值班制度

  1、各代維項目部在啟動抗災救險預案后應實行24小時值班制度,設立固定值班地點和24小時值班熱線。

  2、全體應急人員保持24小時開機。

  3、在接到上級關于進入應急狀態(tài)的通知后,即由領導小組成員組成指揮中心。

  十、體保障措施細則:

  1、根據(jù)每年的雨情在進入梅雨季節(jié)后將基站及分布系統(tǒng)代維的工作重點轉為重點機房、基站等重點防汛場所的巡視,故障處理。在遇到突發(fā)或緊急時間期間,加強對重點基站、低洼基站及傳輸機房的巡視,確保環(huán)境監(jiān)控系統(tǒng)工作正常。重點基站及傳輸機房一周一次,低洼基站二周一次。臺風期間每天對拉線塔進行巡檢,并填寫基站巡檢表。

  2、重點保障地點預置好防汛搶險物資。并給各維護小組配備部分隨車搶險物資。如編織袋、鐵鍬、雨衣、雨靴、防火泥、防火包、手電等。對抽水泵,移動油機進行保養(yǎng),確保其工作正常。對應急燈、應急手機定期充電。

  3、出現(xiàn)連續(xù)暴雨或臺風情況時,維護人員每天對重點站點及所有拉線塔進行巡視,填寫基站巡檢表。發(fā)現(xiàn)緊急情況立即通知我公司地區(qū)經(jīng)理和移動代維管理人員,由代維管理人員上報移動部門領導,并趕赴現(xiàn)場確認,視情況確定是否安排專人(人員由綜合部安排)進行24小時值守。

  4、網(wǎng)管值班人員對環(huán)境監(jiān)控設備出現(xiàn)的告警密切觀察并記錄,若確有異常情況發(fā)生,立即通知我代維人員趕赴現(xiàn)場檢查。并追蹤代維人員的處理情況和反饋結果,若發(fā)現(xiàn)代維人員未及時處理,我網(wǎng)管值班人員應立即向我公司和移動公司匯報。

  5、進入汛期后由各項目部負責每天了解所在區(qū)域的水位情況,并通知網(wǎng)管值班人員,由網(wǎng)管值班人員通知我代維人員及移動代維管理人員,根據(jù)水位情況合理調度巡視隊伍與車輛。

  6、收到臺風警報后,各項部項目經(jīng)理立即組織代維人員對全區(qū)拉線塔進行巡檢,發(fā)現(xiàn)異常發(fā)現(xiàn)緊急情況立即通知移動代維管理人員和我公司應急領導小組,視情況確定應急措施。

  7、收到大雪或暴雪預報,組織維護人員對所轄基站中拉線塔基站、彩鋼瓦基站進行重點巡檢,當?shù)玫骄W(wǎng)管或其他人員通知所轄基站中有拉線塔基站、彩鋼瓦基站出現(xiàn)故障或非正常情況,立即派搶修人員奔赴現(xiàn)場,并逐級上報。

機房應急預案14

  由于機房內部用電設備多,供電線路復雜,電器設備連續(xù)運轉,導致線路設備發(fā)熱量大,甚至出現(xiàn)線路設備提前老化,極易發(fā)生供電線路和電氣設備起火現(xiàn)象,任何人員一旦發(fā)現(xiàn)火情,要沉著冷靜視火情情況進行操作:

  1:“先斷電,后滅火”是撲滅電氣火災的基本原則,在切斷電源時要根據(jù)現(xiàn)場火勢、著火設備進行判斷,考慮重要負荷、消防電源的影響以及配電系統(tǒng)回路的分布,防止火災未救,人員先被電擊或灼傷。如果發(fā)現(xiàn)機柜內設備出現(xiàn)內部打火、冒煙但沒有明火出現(xiàn)時,要立即拔掉該設備的電源插頭,并把該設備拿離機柜,防止危害其他設備;發(fā)現(xiàn)局部輕微著火不危機其他設備的情況下,要立即斷開該設備電源,并組織人員利用就近消防器材進行滅火,防止火勢蔓延擴大,并向領導報告;發(fā)現(xiàn)設備火勢大危機整個機柜但不危機人員生命還能控制時,立即對應機柜編號,斷開整個機柜電源,并組織人員使用氣體滅火器進行撲火,發(fā)現(xiàn)UPS電池組著火時先斷開電池組箱體上的控制開關,必要時再斷開電源室控制UPS的總斷路器,用氣體滅火器滅火,如果火勢大不能控制應立即向負責人匯報、撥打119報警,根據(jù)情況切斷機房總電源再進行組織滅火。

  2:組織實施:在消防車來之前,先盡力使用現(xiàn)有消防設備將火勢控制在最小范圍。 消防車來之后,值班人員配合消防專業(yè)人員撲救或作好輔助工作。 迅速組織人員逃生,原則是“先救人,后救物”, 及時安全地疏散人員和財產(chǎn)轉移;饎荽髸r可用滅火器邊噴邊撤退,確保人員安全。

  3:注意事項:發(fā)現(xiàn)火災撥打火警電話119報警時要講清詳細地址、起火部位、著火物質、火勢大小、報警人姓名電話、并派人到路口迎候消防車;馂氖鹿适滓囊粭l是保護人員安全,撲救要在確保人員不受傷害的前提下進行。 發(fā)現(xiàn)火災時應掌握的原則是邊救火,邊報警。人員在逃生時應掌握正確的逃離方法。救火時不要冒然開窗,以免空氣對流,加速火勢蔓延。

  4:滅火器材:電氣火災隱患存在具有一定的隱蔽性,它的發(fā)生來得快具有突發(fā)性,促成火災發(fā)生的原因受多因素影響而且各因素之間具有關聯(lián)性,火災形成后的分解物中有毒氣,容易蔓延,即使斷電也可能有殘留電壓存在,所以撲滅電氣火災應用氣體滅火器,“二氧化碳”滅火器主要適用于撲滅貴重設備、檔案資料、電氣設備和其他一般物質的.初期火災。不導電,電壓超過600v時,應切斷電源;“1211”滅火器是一種具有高效、低毒、腐蝕性小、滅火后不留痕跡、不導電、使用安全、儲存期長的新型優(yōu)良滅火劑,特別適用于撲滅油類、電氣設備、精密儀器及一般有機溶劑的火災;

  值班人員應經(jīng)常開展事故預想、安全活動討論、學習消防知識、模擬消防演練等多種形式的活動,增強對火災事故處理方法的認識,在火災事故發(fā)生時能做到頭腦清晰、有條不紊,提高火災事故處理的效率。同時還要對已發(fā)生的火災事故的原因進行認真分析,調查處理,做到四不放過:

  (1)事故原因不查清不放過;

 。2)事故責任者得不到處理不放過;

  (3)整改措施不落實不放過;

 。4)教訓不吸取不放過,預防火災事故再次發(fā)生。

機房應急預案15

  高性能計算技術及應用水平已成為顯示綜合國力的一種標志。高性能計算機持續(xù)不間斷地為用戶提供高性能計算服務,而運維應急預案是主機運行中處理突發(fā)事件的依據(jù)和方法,是主機系統(tǒng)穩(wěn)定運行的保障。本文簡要介紹上海超級計算中心主機運維應急預案,供同行參考。

  1.主機和運維管理制度簡介

  超級計算機是功能最強、運算速度最快、存儲容量最大的一類計算機。目前只有少數(shù)國家掌握研發(fā)技術,系統(tǒng)造價非常昂貴,多用于國家高科技領域和尖端技術研究,是國家科技發(fā)展水平和綜合國力的重要標志。上海超級計算中心作為上海信息港主體工程之一,國家和上海市政府投資先后引進神威-I超級計算機、神威-64P集群計算機、曙光4000A超級計算機系統(tǒng)并投入商業(yè)化運行。

  上海超級計算中心自20xx年正式開通至今,這些高性能計算機系統(tǒng)已安全、穩(wěn)定運行七年多時間,上機用戶取得了豐碩的科研成果和社會效益。在這七年中,為保障這些高性能計算機系統(tǒng)安全、穩(wěn)定、不間斷地運行,技術支持部在中心引進第一臺高性能計算機--神威-I超級計算機系統(tǒng)的同時,建立了機房應急預案、運行記錄、設備運行參數(shù)等基礎運維制度,在二期引進曙光4000A超級計算機系統(tǒng)過程中,不斷完善原有運維制度,并針對該主機系統(tǒng)特點編寫了大量操作方法和應急預案。

  中心自20xx年獲得ISO27001(BS7799)信息安全認證以來,技術支持部根據(jù)其要求規(guī)范了文檔體系建設,形成了機房管理制度、應急預案、操作方法、運行情況記錄的四大類運維文檔。

  正是這些運維管理制度的不斷完善和有效執(zhí)行,才確保了資產(chǎn)價值高、服務對象廣、社會影響大的中心主機系統(tǒng)安全、穩(wěn)定運行,保障重點項目、用戶服務的連續(xù)性。

  2.應急預案重要性

  上海超級計算中心機房運維管理文檔劃分為機房管理制度、應急預案、操作方法、運行記錄共四大類(如圖1所示)。

  圖1應急預案分類

  應急預案在應急系統(tǒng)中起著關鍵作用,它明確了在突發(fā)緊急情況發(fā)生之前、發(fā)生過程中以及剛剛結束之后,誰負責做什么、何時做,以及相應的策略和資源準備等。它是針對可能發(fā)生的重大事故,按照其影響和后果嚴重程度,在應急準備、響應、操作各個方面預先做出的詳細安排,是開展及時、有序和有效事故應急工作的行動指南。因此,應急預案在這四類運維管理文檔中處于最為重要的地位。

  3.應急預案分類

  應急預案按重要性和事件種類,可以劃分為消防預案、斷電預案、空調預案、其他預案共4種,預案各文檔之間彼此獨立又互為關聯(lián),具有非常強的可操作性。制定預案的指導原則是盡一切可能,最大限度地確保向用戶提供的服務不中斷。在緊急事件發(fā)生的情況下,保證核心設備連續(xù)運行,避免存儲數(shù)據(jù)丟失。在事件處置完成后,能快速恢復高性能計算服務。

  3.1消防預案

  消防預案是主機房最重要的應急預案。該類預案根據(jù)《上海超級計算中心滅火和應急疏散預案》的原則并結合主機房主機設備和消防設備的運行特性而制定。主要由《主機房消防應急預案》和《主機房氣體噴淋消防系統(tǒng)啟動撤離及處置應急預案》2個文檔組成。

  消防應急預案:該預案著重規(guī)范了火警事件發(fā)生后,所有主機維護人員如何根據(jù)所屬區(qū)域和現(xiàn)場情況,判斷和選擇正確的處理方法,同時配合中心物業(yè)人員處置,降低事件帶來的影響。

  對于設備發(fā)生煙霧,主機維護人員協(xié)同物業(yè)人員尋找煙霧點予以切斷相關區(qū)域電源;當設備發(fā)生可以控制火情,協(xié)同物業(yè)人員滅火;當主機房發(fā)生火災而無法控制,應采取施救方法等措施。

  氣體噴淋預案:該預案描述主機房氣體噴淋系統(tǒng)啟動的響應和確認并具體規(guī)定了撤離機房路線、善后處置。

  這兩個預案中,消防應急預案作為消防預案的`主體,涉及到如何處理與消防有關情況的各個方面。氣體噴淋預案是主機房發(fā)生重大火災時應對的最終滅火手段和人員撤離引導方法。

  3.2斷電預案

  斷電預案的重要性僅次于消防預案。該類預案根據(jù)中心供配電系統(tǒng)實際情況和各種斷電影響范圍下對主機運行的最小保障要求而制定的。主要由《主機房斷電應急預案》、《曙光4000A超級計算機系統(tǒng)緊急關機操作方法》、《曙光4000A超級計算機系統(tǒng)雙路斷電關機操作方法》等多個文檔組成主機房斷電應急預案:該預案用于斷電情況下,主機維護人員如何與中心物業(yè)部門聯(lián)系控制主機房供電情況,并且負責對主機系統(tǒng)運行受斷電影響程度做出正確判斷。指導維護人員按影響程度,分別選用預案中對應的操作方法。本預案在所有斷電預案中起指導思想作用。緊急關機操作方法:該預案制定了主機系統(tǒng)在緊急情況下,最快速度關機的操作步驟。主要用于發(fā)生煙霧、明火或消防、斷電預案需在數(shù)分鐘內關機斷電的事件。

  雙路斷電關機操作方法:該緊急操作預案主要用于在外界雙路供電全部中斷情況下的操作。

  該預案的關機原則是:根據(jù)實際電力供應考慮操作步驟,寧慢勿快,在時間允許的情況下,最大程度保證存儲節(jié)點、SAN和SCSI存儲設備、工程用戶的計算節(jié)點的運行,盡可能減少關閉范圍,以確保能在恢復供電的情況下,主機盡快恢復正常運行狀態(tài),減少影響范圍。

  3.3空調預案

  超級計算機系統(tǒng)在運行中消耗大量電能,在

  提供高性能的計算能力同時產(chǎn)生大量的熱量,必須采用專用空調系統(tǒng),以保持主機系統(tǒng)適當?shù)臏、濕度、空氣潔凈度等運行環(huán)境需求。因此,專用空調系統(tǒng)與主機系統(tǒng)密切相關,空調預案是主機房必備的應急預案。

  制定該預案的原因在于,斷電情況下,空調與主機系統(tǒng)存在互相牽制的現(xiàn)狀。主機和空調系統(tǒng)均為外界雙路供電,主機系統(tǒng)配有UPS不間斷電源系統(tǒng),而空調系統(tǒng)無UPS支持。在雙路停電情況下,主機系統(tǒng)可獲得UPS電池組支持運行若干分鐘,空調系統(tǒng)無UPS支持只能停機。由于在無空調冷卻情況下,主機系統(tǒng)會在短時間內積聚大量熱量導致超過運行警戒溫度,主機系統(tǒng)在有可供電余量的情況下,仍將被迫關機。因此,確?照{中斷情況下的主機運行環(huán)境是該預案的制定原則。

  預案根據(jù)各臺主機配備的空調系統(tǒng)特點制定,由《曙光機房空調系統(tǒng)故障應急預案》和《神威機房空調系統(tǒng)應急預案》2個文檔組成,這里僅介紹曙光機房空調系統(tǒng)應急預案。

  該預案的第一步:考慮增強主機系統(tǒng)散熱效果,采用打開主機機柜前后門,和機房周邊木門,在通風道上布置有UPS支持的應急風扇,形成空氣對流,帶走熱空氣,從而增強主機系統(tǒng)散熱效果,降低升溫速度。

  該預案的第二步:在采取上述措施并持續(xù)升溫到一定溫度之上的情況下,考慮緊急關閉部分或全部計算節(jié)點,減少熱量生成,確保主機系統(tǒng)的核心存儲和網(wǎng)絡系統(tǒng)不受影響,確?照{系統(tǒng)修復后,主機系統(tǒng)能快速恢復運行。

  3.4其他預案

  除了固定的三類預案之外,技術支持部還根據(jù)主機系統(tǒng)實際運行中出現(xiàn)的各種意外情況,隨時制定具有針對性的預案。

  如《大樓頂棚坍塌應急操作方法》的制定,就

  是由于20xx年1月連續(xù)發(fā)生雨雪等災害性天氣,中心大樓頂棚大量積雪且難融化,物業(yè)預計存在情況繼續(xù)惡化,有發(fā)生頂棚坍塌事故的可能,一旦發(fā)生將影響一樓主機運行。

  針對該突發(fā)的隱患,中心技術支持部制定應急操作方法,對維護巡查頻度范圍、漏水可能發(fā)生位置、如何處理受漏水影響的主機設備等操作步驟進行嚴格界定。即使在最后,中心大樓頂棚經(jīng)受住災害性天氣的考驗,該預案并未發(fā)揮作用,這正體現(xiàn)了應急預案的備而不用的特點。而且通過各種意外

  情況的迅速分析、應對和實踐操練,不斷鍛煉主機維護隊伍,使之走向成熟。

  4.在實際案例中,應急預案的作用

  在主機系統(tǒng)年復一年的運行中,我們希望這些設備正常穩(wěn)定運行,應急預案永遠不會被使用,然而在實際運行中,總免不了因突發(fā)事件執(zhí)行應急預案。

  而每次突發(fā)事件是檢驗應急預案制定是否科學、有效的最好證明。

  4.1雙路斷電,UPS正常運行案例

  20xx年8月某天,因打雷導致供電一路跳閘自動換至另一路供電,曙光機房2臺空調掉電。

  主機維護人員立即按應急預案操作,電話通知物業(yè)人員恢復空調運行,恢復過程中所有空調相繼出現(xiàn)高溫報警,機柜液晶屏平均溫度35度,開啟全部曙光機柜前后門,打開神威-曙光玻璃門并調集應急電扇,于12:45恢復正常。

  12:50再次出現(xiàn)雙路供電中斷,曙光空調因無

  UPS支撐全部斷電,啟動斷電應急預案,開啟

  5、6號木門,開啟神威機房全部空調,布置電扇,將冷氣導入曙光機房,熱量從6號木門的外部通道排出,選擇性殺除部分作業(yè),至13:05供電恢復,曙光空調開始工作,13:20環(huán)境恢復正常。全機在此過程中,正常運行未停機,只損失了部分不重要的作業(yè)。

  4.2單路斷電,UPS失效案例

  20xx年8月某天,因低壓配電柜開關至UPS房間X-JM柜電纜發(fā)生相對地短路,造成UPS機組逆變器自身保護動作,關閉UPS機組,導致曙光主機系統(tǒng)失電。

  全機掉電后,主機維護人員迅速按應急預案

  手工關閉所有電源開關。10:30恢復供電,溫濕度恢復正常后,全機加電,恢復過程中修復

  storage00

  1、00

  5、010三個盤陣的9個用戶文件系統(tǒng),修復15個節(jié)點加電故障,除cnode00

  9、anode029電源

  環(huán)境模塊故障,于當日15:10全機系統(tǒng)恢復正常。

  由于處置及時,主機受影響范圍很小,在恢復供電后數(shù)小時即成功開啟全系統(tǒng)。

  5.隨時保持應急預案的適用性

  主機長年累月的運行,故障和問題的發(fā)生,往往是必然的,也是客觀、無法回避的。因此,要求在維護工作中,預先考慮到可能的問題和故障,制定完善的應急預案。應急預案不可能包含所有的故障和問題,但應根據(jù)維護經(jīng)驗,盡可能地設想各種危機情況下的處置措施。做到預想到各種可能的問題。

  而在形成應急預案后,更重要的是持續(xù)地在

  運行中加以完善、測試和演練,盡可能模擬實際情況,做到即使只有1名維護人員在場,也能在真正發(fā)生危機時,以最短時間獨立處置故障。

  以目前中心的主機運維工作為例,三年內,僅斷電預案就已根據(jù)實際運行情況的變化,制定并更新了5~6個版本,針對夏季突發(fā)斷電也有專用預案。這樣的措施,直接保障了20xx年8月突發(fā)斷電事件中的主機連續(xù)運行。而20xx年8月的突發(fā)斷電事件中,由于預案在之前剛根據(jù)實際情況進行過演練和修改,主機維護人員僅用半小時就完成所有應急操作動作,整機僅有個別設備故障,確保了主機設備未因突發(fā)斷電而發(fā)生大范圍損壞現(xiàn)象,恢復供電后直接完成開機。

  實踐證明,完善而適用的應急預案能保障向用戶提供穩(wěn)定的高性能計算服務。

  6.結束語

  完備而適用的應急預案能有效降低主機系統(tǒng)因意外事件發(fā)生帶來的運行風險,對可能發(fā)生的意外來說,是一種事前防范措施。但對整個主機系統(tǒng)產(chǎn)品而言,是一種事后防范措施。如果主機系統(tǒng)生產(chǎn)廠商能把這些防范措施納入整個系統(tǒng)設計過程中,使操作方法更加簡便、更趨于人性化,這將幫助主機維護人員更為妥善處理意外事件,用戶得到更為穩(wěn)定的高性能計算服務。我們相信未來國產(chǎn)的高性能計算機能做到這一點,期待著這一天早日到來。

 。閹椭私猓卦诟戒浿泄(jié)選部分雙路斷電關機預案內容)

  附錄:《曙光4000A超級計算機系統(tǒng)雙路斷電關機操作方法》(省略具體操作步驟)

  曙光4000A超級計算機系統(tǒng)雙路斷電關機操作方法

  注意:

  1、本方法專用于主機房發(fā)生雙路同時斷電緊急操作使用。(包括單線斷電切換失敗)。

  2、本方法作為《曙光-4000A超級計算機系統(tǒng)緊急關機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX)的附件。

  1.斷電確認及操作:

  主機房內一旦發(fā)現(xiàn)斷電,并接物業(yè)明確通知為雙路斷電,首先執(zhí)行如下操作(即確保節(jié)點溫度):

  1.1打開機房門便于散熱,..

  1.2機房通道上布置應急風扇加強冷熱空氣對流,夏季:應急風扇布置..;冬季:應急風扇布置..,使曙光

  機房的溫度盡量降低。

  1.3打開所有機柜前、后門。

  1.4密切注意機房節(jié)點平均溫度(專指各機柜液晶面板所示之環(huán)境溫度值)。

  2.緊急關機條件確認:

  在完成上述操作后,密切觀察主機房環(huán)境。一旦有如下任何一個條件滿足:

  2.1自斷電發(fā)生起,已達到XX分鐘仍未恢復供電;

  2.2采取上述緊急通風措施,節(jié)點溫度持續(xù)上升,超過XX℃;

  可認定為緊急斷電事件,即刻按下列緊急關機操作方法進行操作。

  3.緊急關機操作步驟:

  注意事項:

  3.1..

  3.2關機操作的全過程中,注意隨時保持和物業(yè)的通訊聯(lián)系。除根據(jù)情況隨時聯(lián)絡外,應嚴格保證每XX分鐘與物

  業(yè)聯(lián)系一次,詢問UPS可支撐時間及恢復供電可能。(分機、手機、對講機等)

  3.3應理解關機原則為:根據(jù)實際電力供應考慮操作步驟,寧慢勿快,在時間允許的情況下,最大程度保證X排節(jié)

  點、存儲節(jié)點、SAN和SCSI存儲設備的運行,盡可能減少關閉范圍,以確;謴汀

  第一級操作:(首先執(zhí)行)關閉主機系統(tǒng)外圍設備..

  第二級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,執(zhí)行如下操作)

  關閉非重要用戶計算節(jié)點(ABC組)..

  第三級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,執(zhí)行如下操作)

  關閉所有用戶計算節(jié)點(D組)..

  第四級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,執(zhí)行如下操作)

  關閉SAN存儲設備和LSF數(shù)據(jù)庫服務器..

  第五級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,完成關機操作)

  關閉SCSI磁盤陣列和所有存儲節(jié)點..

  特別關注:

  1.如時間非常緊急,UPS電池低于XX分鐘:

  直接執(zhí)行關機腳本:..

  此腳本可分別將計算節(jié)點、接入節(jié)點、存儲節(jié)點進行關閉。

  2.如時間極其緊急,UPS電池低于XX分鐘,可按《曙光-4000A超級計算機系統(tǒng)緊急關機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX),直接拉閘操作。

 。ㄉ鲜龆䝼方法僅用于突發(fā)情況,非極其必要情況下嚴禁使用,應使用前列方法操作)

  3.如遇主機失電(如關機操作不及已掉電或突發(fā)自動掉電)應關閉所涉范圍所有設備電閘開關。..

【機房應急預案】相關文章:

【經(jīng)典】機房應急預案02-10

機房應急預案12-24

機房應急預案[精選]03-17

機房應急預案【熱門】02-10

機房網(wǎng)絡應急預案08-30

機房應急預案[熱]02-10

【集合】機房應急預案02-28

機房火災的應急預案10-28

CT機房 應急預案03-28

[推薦]機房火災應急預案08-29