1 引言
從美國9.11世貿大樓的恐怖襲擊,到我國的5.12汶川特大地震,“災難”這個詞對我們來說已并不陌生。前一段時間的日本島9.0級巨大地震,更是令人感到無比的震撼。隨著企業信息化建設的迅猛發展,企業信息系統已成為現代企業運營的基礎平臺,企業數據更是關系到企業自身利益的核心資源。具Gartner Group統計:在經歷大型災難而導致系統停運的公司中有2/5再也沒有恢復運營,剩下的公司中也有1/3在兩年內破產。美國明尼蘇達大學的研究表明:在遭遇災難的同時又沒有災難恢復計劃的企業中,將有超過60%在兩到三年后退出市場。未雨綢繆,如何應對災難性事件的發生,保障企業數據的安全性和信息系統的業務連續性,已成為企業信息化建設中需要重點思考的課題。本文將對企業容災系統建設的基本概念、建設等級、建設方案及恢復演練等方面的內容進行探討,旨在幫助企業加快容災系統的建設步伐,有的放矢,合理構建企業信息系統的避風港。
2 認識容災技術
災難恢復防范的災難包括地震、水災等自然災害以及火災、戰爭、恐怖襲擊、網絡攻擊、設備系統故障、人為破壞等無法預料的突發事件。容災的主要目標是提高抵御災難和重大事故的能力、減少災難打擊和重大事故造成的損失、確保重要信息系統的數據安全和作業持續性。在容災領域有一些關鍵的術語,了解和掌握這些概念將有助于容災系統建設的方案設計和實施,分別介紹如下:
(1)災難恢復(或稱容災備份)(disaster recovery,DR):是指利用技術、管理手段以及相關資源,將信息系統從災難造成的故障或癱瘓狀態恢復到可正常運行狀態,并將其支持的業務功能從災難造成的不正常狀態恢復到可接受狀態的活動和流程。(《重要信息系統災難恢復指南》)。
(2)恢復時間目標(Recovery Time Objective,以下簡稱RTO):RTO表示了從災難發生直到業務流程再次運行(即被恢復)的時間。RTO有兩個組成部分,明確災難發生后指示恢復流程開始的決策時間(Decision Time)和進行災難恢復流程的實施時間(Deployment Time)。一般來說,恢復時間(RTO)越短,那么災難恢復方案的成本就越高,但是由于災難造成的業務損失就越小;反之,恢復時間(RTO)越長,災難恢復方案的成本較低,但是由于災難造成的業務損失就較大。
(3)恢復點目標(Recovery Point Objective,以下簡稱RPO): RPO是災難發生后業務能夠容忍的數據丟失量,或者說災難發生造成的數據丟失量。一般來說, RPO越高(即,丟失的數據越少),容災的成本越高,但是由于災難造成的業務損失就越小;反之,RPO越低(即,丟失的數據較多),容災的成本越低,但災難造成的業務損失也越大。
3 容災系統的建設等級
建設容災系統前企業必須對自身IT現狀做詳細調研分析,圍繞RTO、RPO兩個主要業務指標,參照國家標準《重要信息系統災難恢復指南》,通過科學的手段分析并制定建設等級、建設目標。國標中包含七個關鍵要素:數據備份系統、備用基礎設施、備用數據處理系統、備用網絡系統、技術支持能力、運行維護管理能力、災難恢復預案,按照這七個要素將災難恢復劃分為六個等級,等級越高,容災系統越完善、企業受到的經濟損失就越小,但同時企業投入的人力、物力、財力就越高。一般企業根據業務系統重要程度的不同,經常采用等級為第2級、第3級和第5級的容災策略。
第6級為最高等級,相對于第5級的實時數據復制而言,要求實現遠程數據實時備份,實現零丟失;備用數據處理系統具備與生產數據處理系統一直的處理能力并完全兼容,應用軟件是集群的,可以實現實時無縫切換,并具備遠程集群系統的實時監控和自動切換能力;對于備用網絡系統的要求也加強,要求最終企業可通過網絡同時接入主、備中心;備用場地還要7×24專職操作系統、數據庫和應用軟件的技術支持人員,具備完善、嚴格的運行管理制度。
4 容災系統的建設步驟
企業容災系統的建設需要遵循國家、行業的相關文件規定,依據科學的步驟來逐步執行。典型的容災系統建設步驟大致如下:
4.1業務分析
這是容災系統建設方法論的第一步,企業需要根據自身現狀收集業務需求、災難類型、技術基礎架構(如企業內部IT架構、IT部門組織、使用技術、軟硬件、網絡架構等),確定需要防范的風險,在風險分析中確定不同的業務級別的業務恢復時間RTO和可承受的數據損失程度RPO。
4.2策略制定
根據第一個階段得出的結果,確定容災系統的投入預算,選擇切合實際、投資合理、可靠的容災方案。這個階段需要著重考慮容災中心的選址、兩地間的距離、運營方式、容災中心的規模、合適的技術、合適的產品。
4.3方案實施
根據制定的容災方案,制定詳細的方案和項目計劃,分階段進行實施。實施內容包括技術實施、場地實施、、初步的DRP(容災恢復計劃)開發、首次演練、文檔及培訓等。
4.4測試演習維護
此階段主要是測試和驗證容災系統、維護容災系統的正常運行、制定容災管理制度和流程、人員&技術培訓、演習。
5 典型容災方案的對比分析
IT系統構成的不同使容災技術類型也有很大的差異,各類技術與現有IT系統的吻合程度主要取決于系統本身的組成和建設要求。比如,IT系統由多操作系統組成,并且容災系統不能更改生產系統原有的格局,則可行的技術手段就極為嚴格,需要相當慎重的選擇。以往,由于容災技術實現手段有限,主要有主機型和存儲型兩大類容災方式,而今天,出現了具有更強能力的存儲網絡型的虛擬化容災方式,使得容災的技術手段開始豐富起來。
5.1主機型遠程容災
基于主機的容災技術,簡單地說,就是通過安裝在服務器的數據復制軟件,或是應用程序提供的數據復制、災難恢復工具(如數據庫的相關工具),利用TCP/IP網絡連接遠端的容災站點的服務器,實現異地數據復制。其中最為成熟的和應用最廣泛的就是Veritas Volume Replicator(VVR)軟件。
5.2存儲系統型異地容災
顧名思義是基于存儲系統(光纖磁盤陣列、NAS)的模式。通過存儲系統內建的固件(firmware)或操作系統,通過IP網絡或DWDM、光纖通道等傳輸界面連結,將數據以同步或異步的方式復制到遠端。知名的存儲系統型遠程容災方案有SRDF、TrueCopy、PPRC等。
5.3虛擬化容災
一種網絡存儲型遠程容災架構,是在前端應用服務器與后端存儲系統之間的存儲區域網絡(SAN),加入一層存儲網關,這個網關和我們所了解的網絡網關不同,它結合了網絡存儲專用管理器,前端連接服務器主機,后端連接存儲設備。它的角色就好像是存儲網絡中的交通警察,所有的I/O都交由它來控制管理。當然,現在也出現了旁路(side-band)的控制方式,對于I/O流量進行旁路監控和分流,實現異地數據復制。
由于數據復制是通過存儲網關來執行,應用服務器只需數據庫執行代理程序,相對于主機型遠程容災來說,它的性能影響十分低。另外,通過存儲網關的虛擬化技術,可以整合前端異構平臺的服務器和后端不同品牌的存儲設備,本地端和災備端的設備無需成對配置,企業可以根據RTO和RPO,在遠端建立完整的熱備份中心。當本地端發生災難時立即接管業務運行,或是采取僅在災備端安裝存儲設備的溫站配置,先保護數據的完整性和安全性,在本地端修復完成后再進行恢復。
除此之外,虛擬化容災技術還具有以下優勢:
(1)構造時不需更換原有的IT基礎架構,只需在原本的存儲區域網絡中加入存儲網關,本地端的主機和存儲設備可以是任何品牌,災備端的主機和存儲設備也不需和本地端相同,企業甚至可以在災備端采用等級較低的存儲系統(如SATA磁盤陣列),根據統計,投資成本可節省多達30%左右,對于那些有構造遠程容災的熱切需要而IT預算又十分有限的企業來說,虛擬化遠程容災無疑是最佳的選擇。
(2)針對數據庫專用代理確保數據庫具有完整的容災和啟動能力,無需擔憂無法啟動的現象發生。更為重要的是,在存儲數據上進行的多點快照等增值功能,能使得各種數據的人為破壞得到瞬間恢復的能力(也就是歷史數據的恢復能力,這在前兩種容災方式中是一種恢復的盲點)。
(3)對于異地傳輸的帶寬占用,虛擬化容災方式具有各類調優方式,使得這種方式能夠最大限度適應企業現有的網絡環境。
6 容災系統的恢復演練
建設容災系統的目的就是在災難發生后能夠盡快恢復業務系統,減少IT系統故障給企業帶來的經濟損失。因此,完成系統建設后,還必須定期組織嚴格規范的災備演練、測試活動,規范和完善企業IT系統的應急體制,加強應急團隊建設,提高維護人員的業務水平,從而在災難發生后能夠快速、高效的完成業務恢復。
容災的演練計劃有以下幾種方式:
6.1計劃性測試/演練
災難恢復計劃要求建立業務連續性管理團隊,不僅涉及IT部門,而且關聯眾多業務部門,為減少演練對于生產的影響,可以將恢復計劃細化到很小的單位或者模塊,逐個應用進行接管驗證。當模塊都成功通過測試后,測試的范圍可以擴充到更多的模塊。
6.2突發演練
在容災系統全面完成并且制定了全面的恢復計劃后,可以在進行了一定備份的情況下安排突發性的測試。當然,業務連續性管理小組需要確保業務不會因為突發性測試造成不可接受的損失和業務中斷。
演練對于提高團隊的恢復經驗和協作能力以及確保災難恢復計劃的可行性是至關重要的。所有的演練結果都要進行評估、記錄,并且生成到容災流程里。
7 總結
災難的發生是“小概率、高風險”事件,隨著企業信息化水平的不斷提高,為規避風險,容災系統對于企業重要信息系統已成為必不可少的信息安全基礎設施。容災系統的建設是一個系統工程,只有科學合理地進行容災系統的設計與部署,才能對企業信息系統的安全運行起到根本的保障作用。因此,企業在容災系統的建設過程中,必須充分考慮重要信息系統的抗毀性與災難恢復,合理選擇容災技術,制定和不斷完善信息安全應急處置預案,提高應急處置和災難恢復能力,才能保證在遭遇重大災難和重大事故時發揮有效的容災功能,真正構建企業信息系統的避風港。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.guhuozai8.cn/
本文標題:構建企業信息系統的避風港
本文網址:http://m.guhuozai8.cn/html/consultation/1083953295.html