1.3.4資源調(diào)度算法
在大規(guī)模的虛擬機集群中,虛擬機數(shù)目和虛擬機的負(fù)載會隨用戶和應(yīng)用的需求而經(jīng)常變化,靜態(tài)的資源分配往往會使虛擬機產(chǎn)生資源浪費或資源不足的情況,因此,虛擬機需要進行動態(tài)的資源調(diào)度:在虛擬機數(shù)量偏少和平均負(fù)載偏低的情況下,將虛擬機集中遷移到較少的物理機上,并將一部分物理機停機,以達(dá)到節(jié)能和提高計算/能耗比的目的;在虛擬機數(shù)量偏多和平均負(fù)載偏高的情況下,啟動更多的備用物理機并進行負(fù)載平衡。同時,由于虛擬機中的應(yīng)用負(fù)載會隨時間變化,因此應(yīng)及時響應(yīng)虛擬機負(fù)載的變化,適當(dāng)為高負(fù)載的虛擬機分配更充裕的資源,以適應(yīng)虛擬機對資源的需求。
資源調(diào)度算法的基石是虛擬機遷移算法。虛擬機遷移算法分為預(yù)拷貝、停機拷貝和后拷貝3個階段,目前有很多成熟的研究成果可以在100 ms內(nèi)完成虛擬機的遷移。而資源調(diào)度算法的實現(xiàn)則更為復(fù)雜。總體上,資源調(diào)度算法的步驟如下:
1)獲取虛擬機集群中所有物理機與虛擬機的性能監(jiān)控數(shù)據(jù),并針對不同類型資源的特點評估物理機與虛擬機的資源負(fù)載狀態(tài)。
2)根據(jù)評估指數(shù)值,選擇需要調(diào)度的虛擬機,并計算合適的目標(biāo)結(jié)點,進行虛擬機的遷移。
3)列舉虛擬機集合中所有負(fù)載高于上限值的虛擬機,用最佳適應(yīng)算法尋找調(diào)度后物理資源負(fù)載最高但不超過物理負(fù)載上限閡值的物理機,遷移虛擬機到此物理機上。
本文的云計算資源管理平臺使用的資源調(diào)度算法的典型流程如圖5所示。
圖5資源調(diào)度算法的流程
1.4主要功能
1)異構(gòu)資源整合管理。災(zāi)備中心有大量的異構(gòu)資源,存在不同廠家、不同型號的主機和存儲設(shè)備,云計算資源管理平臺具備對異構(gòu)資源進行整合管理的功能,通過統(tǒng)一的界面管理不同的資源。
2)資源按需申請、自動部署。云計算管理平臺為用戶提供資源按需申請的能力。用戶可通過云計算資源管理平臺的界面,提出資源使用需求,經(jīng)過管理員審核批準(zhǔn)后,云計算資源管理平臺自動為用戶創(chuàng)建所需的資源。
3)資源動態(tài)調(diào)度。云計算資源管理平臺以數(shù)量眾多的服務(wù)器和存儲設(shè)備為基礎(chǔ),組成計算資源池和存儲資源池。云計算資源管理平臺會根據(jù)管理員指定的策略對資源進行動態(tài)調(diào)度,包含虛擬機遷移、集群彈性伸縮、無負(fù)載物理機轉(zhuǎn)入低功耗模式等,提高資源的利用率,降低總體能源損耗。
4)統(tǒng)一鏡像管理。云計算資源管理平臺能夠提供對鏡像文件的高效存儲、保證災(zāi)備端鏡像和生產(chǎn)端版本的一致性、鏡像的冗余備份、歷史鏡像文件的歸檔等功能。
5)支撐災(zāi)備中心特定業(yè)務(wù)。云計算資源管理平臺可根據(jù)災(zāi)備中心數(shù)據(jù)驗證、數(shù)據(jù)演練等核心災(zāi)備業(yè)務(wù)流程提供定制服務(wù)。
2 云計算平臺在電力系統(tǒng)災(zāi)備業(yè)務(wù)中的應(yīng)用場景
2.1總體介紹
云計算資源管理平臺對電力系統(tǒng)災(zāi)備業(yè)務(wù)能夠起到重要的支撐作用。在電力系統(tǒng)災(zāi)備中心,云計算資源管理平臺可以納管管控區(qū)和驗證區(qū)的所有設(shè)備,向各網(wǎng)省和運維系統(tǒng)提供統(tǒng)一的虛擬化數(shù)據(jù)驗證環(huán)境和管理軟件運行環(huán)境,從而提高災(zāi)備中心的管理水平和數(shù)據(jù)驗證工作效率。
2.2災(zāi)備數(shù)據(jù)管理
電力系統(tǒng)災(zāi)備中心負(fù)責(zé)電力企業(yè)的企業(yè)資源計劃(entERPrise resource planning ERP)及管控、營銷、協(xié)同辦公、一體化平臺、生產(chǎn)管理、綜合管理等的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的災(zāi)備。生產(chǎn)端的數(shù)據(jù)通過網(wǎng)絡(luò)利用數(shù)據(jù)庫復(fù)制技術(shù)或存儲復(fù)制技術(shù)備份到災(zāi)備中心高端存儲上,由災(zāi)備中心統(tǒng)一負(fù)責(zé)管理,并開展常規(guī)性的數(shù)據(jù)備份和驗證工作從而保障災(zāi)備數(shù)據(jù)的完整性和準(zhǔn)確性。
2.3驗證區(qū)應(yīng)用場景
電力系統(tǒng)災(zāi)備中心驗證區(qū)的主要工作內(nèi)容是為各災(zāi)備網(wǎng)省公司驗證災(zāi)備數(shù)據(jù)是否正確,使用云計算資源管理平臺納管災(zāi)備中心驗證區(qū)的設(shè)備,并使用基于云計算資源管理平臺的數(shù)據(jù)驗證(簡稱云平臺驗證)方案,可以加快驗證周期,增多同時進行數(shù)據(jù)驗證的網(wǎng)省數(shù)量,在方便管理的同時提高資源利用率和驗證工作效率。
圖6, 7為災(zāi)備中心現(xiàn)有驗證流程和云平臺驗證流程的對比。
從圖中可以看到,整體驗證流程涵蓋了資源的申請、分配、驗證、回收4大步驟,可以為網(wǎng)省公司提供完整的數(shù)據(jù)驗證服務(wù)。目前,災(zāi)備中心沒有數(shù)據(jù)驗證支撐系統(tǒng),驗證工作缺乏IT支持和流程管理,資源分配和回收環(huán)節(jié)完全依賴手工操作,耗時較長,效率較低,人工介入多且管理難度大,資源獨占導(dǎo)致使用利用率有限。而基于云計算資源管理平臺的數(shù)據(jù)驗證方式的使申請、分配、驗證、回收4大步驟形成閉環(huán),極大提升了災(zāi)備中心的數(shù)據(jù)驗證能力。具體分析如下:
圖6災(zāi)備中心現(xiàn)有驗證流程
圖7災(zāi)備中心云平臺驗證流程
1)申請。用戶(各網(wǎng)省公司)在云計算資源管理平臺提出數(shù)據(jù)驗證申請,云計算資源管理平臺負(fù)責(zé)申請過程的審批流程,使原有流程具備IT支撐。
2)分配。分配過程是災(zāi)備中心工作量最大的一個步驟,在其中需要分配網(wǎng)絡(luò)資源,分配主機資源,提供存儲空間,配置網(wǎng)絡(luò)安全訪問,配置SAN網(wǎng)絡(luò),安裝操作系統(tǒng),安裝數(shù)據(jù)庫,導(dǎo)入驗證數(shù)據(jù)。云計算資源管理平臺通過使用虛擬化、模板化、自動化的技術(shù),將以上步驟由平臺自動完成,災(zāi)備中心只需要對用戶的申請進行審批,審批通過后根據(jù)用戶需求配置相應(yīng)參數(shù),云計算資源管理平臺就能自動地完成資源分配過程。
3)驗證。使用云計算資源管理平臺,由于虛擬化技術(shù)的引入,現(xiàn)有的資源可以提供給多個省公司同時使用,從而大大提高了資源的利用率和數(shù)據(jù)驗證工作的效率。
4)回收。由于網(wǎng)省公司使用的驗證資源為虛擬化資源,根據(jù)虛擬化技術(shù)的特點,可以不清空安裝內(nèi)容,而將驗證環(huán)境保存在存儲中,只釋放使用的資源。網(wǎng)省公司未來驗證時可以繼續(xù)使用保存好的驗證環(huán)境,極大地節(jié)省了環(huán)境部署時間。
由此可見,使用云計算資源管理平臺在數(shù)據(jù)驗證的申請、分配、驗證、回收環(huán)節(jié)中,能顯著提高驗證效率,降低管理成本,提高資源利用率。表1為一些具體參數(shù)的對比。
表1 災(zāi)備中心現(xiàn)有驗證方案和云平臺驗證方案性能對比
2.4平臺帶來的經(jīng)濟效益和管理效益
云計算資源管理平臺將災(zāi)備中心的IT基礎(chǔ)設(shè)施能力進行聚合,實現(xiàn)異構(gòu)資源的整合管理,使得IT基礎(chǔ)設(shè)施資源可以按需分配和動態(tài)調(diào)度;在云計算環(huán)境中,通過對業(yè)務(wù)應(yīng)用負(fù)載峰谷的計算,得出錯峰利用資源的方式,使資源在不同應(yīng)用之間來回流動,將資源利用率保持在一個較高的水平上,提升IT基礎(chǔ)設(shè)施的整體承載能力;通過對現(xiàn)有應(yīng)用和資源的優(yōu)化整合,可以空余出許多資源,大大節(jié)省未來的設(shè)備投資;使用統(tǒng)一的界面和流程提供自動化的資源安裝、部署、運維能力,減少運維人員的手工操作,減少資源運維和管理成本。
下面從應(yīng)用運行和災(zāi)備數(shù)據(jù)驗證2個方面對平臺帶來的經(jīng)濟和管理效益進行具體的分析。
在應(yīng)用運行方面,通過云計算資源管理平臺能夠以統(tǒng)一的方式部署、運行、維護和管理應(yīng)用,極大地節(jié)省了管理成本,除此以外,云計算資源管理平臺實現(xiàn)了應(yīng)用的隔離運行和資源的靈活調(diào)配,在顯著提高資源利用率的同時,保障了應(yīng)用的安全穩(wěn)定運行。以上海災(zāi)備中心為例,使用云計算資源管理平臺對管控區(qū)的x86服務(wù)器、HP服務(wù)器、IBM服務(wù)器進行納管,通過資源調(diào)配,應(yīng)用隔離運行等技術(shù)手段,提高了同樣配置服務(wù)器的利用率,并且能夠同時承載更多網(wǎng)省展開驗證工作,經(jīng)過初步研究,資源的利用率至少可以提高1倍。通過云計算技術(shù)的應(yīng)用,節(jié)省了大量硬件采購成本,具有明顯的經(jīng)濟效益。同時,平臺實現(xiàn)了運維流程的統(tǒng)一規(guī)范和部署方式的自動化,節(jié)省了人工投入的時間,極大地提高了運維效率,從而帶來了明顯的管理效益。
在災(zāi)備數(shù)據(jù)驗證方面,使用云計算資源管理平臺后,優(yōu)化了數(shù)據(jù)災(zāi)備的實際流程,縮短了驗證周期,增多了同時驗證網(wǎng)省公司的數(shù)量,提高了數(shù)據(jù)驗證的自動化水平。以上海災(zāi)備中心為例,其驗證區(qū)的x86服務(wù)器、HP服務(wù)器、IBM服務(wù)器通過虛擬化技術(shù)、模板技術(shù)、驗證流程整合等技術(shù)手段能夠在同樣硬件資源能力的基礎(chǔ)上,承載更多網(wǎng)省公司同時進行驗證,這樣可以提高驗證效率,減少人工成本。本文對上海災(zāi)備中心所納管的其中一個應(yīng)用數(shù)量中等的網(wǎng)省進行了測試,原來數(shù)據(jù)驗證中分配環(huán)節(jié)所需時間從一周下降到一天,顯然易見,云計算資源平臺帶來了明顯的經(jīng)濟效益。除此之外,以統(tǒng)一的方式申請數(shù)據(jù)驗證資源,自動化地分配和回收資源,能夠提高運維效率,規(guī)范驗證流程,從而帶來了明顯的管理效益。
云計算資源管理平臺在災(zāi)備中心的定制應(yīng)用可以說是云計算基礎(chǔ)設(shè)施即服務(wù)(infrastructure as a service IaaS)層在電力系統(tǒng)業(yè)務(wù)中的真正落地,切實將云計算技術(shù)與電力系統(tǒng)災(zāi)備業(yè)務(wù)緊密相連,使災(zāi)備業(yè)務(wù)由原來的手工操作模式轉(zhuǎn)變?yōu)榫邆銲T支撐的流程化、自動化模式,極大提高了電力系統(tǒng)災(zāi)備業(yè)務(wù)的信息化水平。
3 結(jié)語
本文總結(jié)了電力系統(tǒng)災(zāi)備中心信息化進程中出現(xiàn)的問題,提出了將云計算技術(shù)引入用以解決問題的具體思路,并就關(guān)鍵技術(shù)進行了討論。設(shè)計并實現(xiàn)了云計算資源管理平臺,該平臺實現(xiàn)了異構(gòu)資源整合管理、資源按需申請、自動部署、資源動態(tài)調(diào)度和統(tǒng)一鏡像管理等功能。目前,平臺產(chǎn)品己經(jīng)應(yīng)用于災(zāi)備中心的實際業(yè)務(wù)中,為電力系統(tǒng)數(shù)據(jù)級災(zāi)備提供了有力支撐。
在未來,借助于云計算資源管理平臺,可以同時管理電力企業(yè)的多個不同災(zāi)備中心資源池,達(dá)到多中心資源統(tǒng)一管理,提升災(zāi)備中心IT基礎(chǔ)設(shè)施的承載能力,為實現(xiàn)多地集中式災(zāi)備中心向一級數(shù)據(jù)中心的演化奠定基礎(chǔ),同時也為電力系統(tǒng)后期面向應(yīng)用級災(zāi)備的演進奠定了良好的技術(shù)基礎(chǔ)。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.guhuozai8.cn/
本文標(biāo)題:云計算在電力系統(tǒng)數(shù)據(jù)災(zāi)備業(yè)務(wù)中的應(yīng)用研究(下)
本文網(wǎng)址:http://m.guhuozai8.cn/html/consultation/1083977457.html