一、引言
近年來,隨著各類應用系統建設速度迅猛發展,信息化技術人員的數量、維護能力和知識水平日顯不足,在實際工作中只能等到設備及應用系統出現問題造成故障時才進行維護,并且IT設備和信息系統多而復雜關聯性日益增強。運維人員有效地降低系統運行的風險,主動的發現并及時解決系統運行故障,這些都給企業IT運維服務管理水平提出了更高的要求,也是當前IT系統運維服務管理與ERP運維普遍面臨的巨大挑戰。面對如此高的要求和壓力,目前的信息化應用平臺單靠人工管理已經變得不現實,因此,通過采取IT運維服務管理系統來輔助信息部門進行半自動化管理,使信息系統更加適應業務持續變化的需求。
二、運維服務與ITIL理念
IT運維服務主要包括基礎設施維護服務、系統運行維護服務和系統運營支持服務。基礎設施維護服務是指對基礎環境、硬件、基礎軟件的故障診斷和修復等服務。系統運行維護服務是指通過使用監控、服務管理工具等方式,保障系統正常運行的服務。系統運營支持服務是指為提升業務有效性所提供的評估、數據管理、數據分析、業務流程管理等服務。
20世紀80年代,英國政府為了提升信息化設備和系統的運行效率,指定當時的英國政府計算機與通信局,研究開發一種方法,用于指導全國政府部門高效、經濟地運營信息化設備和系統,結果產生了信息技術基礎架構庫(Information Technology Infrastruc-ture Library-ITIL)。ITIL供組織內部進行IT服務管理的參考經驗,它匯集了IT服務業內的最佳實踐,是指導如何在運維管理中定義人員、流程、服務活動及其之間關系的指導框架。
ITIL的框架包括業務管理、服務管理、IT基礎架構管理、安全管理、應用管理、IT服務管理規劃等,其中最核心的是服務管理中的服務支持和服務提供。IT主管部門可能更關心服務支持,服務支持主要包括:服務臺、故障管理、問題管理、配置管理、變更管理和發布管理等六個模塊。
為使企業的運維服務更加有效、持續和穩定發展,引進最先進的ITIL管理理念和ISO 20000國際標準,結合制造業在IT運維服務管理情況,提高IT運維服務管理的效率和規范性,保障業務系統的持續穩定運行。
三、企業對于IT服務管理的需求分析
制造業信息化通過多年的建設,形成了眾多的信息系統,如何使信息系統穩定、可靠、安全的運行,IT運維服務管理工作步入一個有序的、規范的層,成為數據中心的一個長期的業務目標。
一方面,數據中心面對的管理工作的范圍也越來越大,從核心的網絡、服務器、數據庫、應用系統到終端計算機。對各種IT基礎架構設施的具體配置、運行狀態、故障、性能進行了集中監控,及時發現故障并報警,同時對運行性能歷史數據進行深入、定量分析,并提供各種中長期運行趨勢和運維報表,及早發現網絡擁塞或系統性能的問題,為IT維護人員提供運維技術手段和工具,提高IT運行監控管理的處理能力的需求越來越迫切。
另一方面,IT系統對于核心業務起著決定性的作用,因此IT服務的可用性以及服務的質量越來越引起重視,并且在未來還將面對越來越多的數據業務,因此對其計算機網絡、系統及各終端設備的穩定性和故障的快速處理、恢復能力的要求,建立合適的工作流程,合理安排人員崗位,明確職責,保障在業務中斷的第一時間找到相關負責人去解決問題,快速恢復業務。
四、IT運維服務管理平臺設計
在進行IT運維服務管理平臺管理設計時,考慮IT服務對業務帶來的影響,強調從業務目標角度出發來優化IT運維服務管理。
(一)IT基礎設施管理
IT基礎設施管理包括網絡、服務器、客戶機、數據庫、應用系統的配置管理、性能管理、故障管理等,系統整體架構橫向分為4層被監控層、數據采集層、匯聚處理層、展現層。
被監控層為IT基礎設施,數據采集層通過與被管基礎設施的接口采集數據,送到數據處理層進行數據處理。匯聚處理層包含2個層面:一個層面是IT基礎架構運行監控,主要實現IT基礎架構的各種監控功能,如網絡拓撲、鏈路流量等;另一個層面是業務服務管理,主要針對業務層面進行監控,包括業務故障影響分析、業務性能指標計算、業務應用性能監控以及業務視圖展現等。最頂層是統一展現層,即統一門戶,為不同級別、不同職能的人員提供整合統一的IT運維管理門戶。
(二)IT服務管理
基于ITIL流程框架,結合現有實際業務需求,遵循“計劃、實施、檢查、改進”的設計原則,建立切實可行的實施方法和流程,將整個體系劃分為服務臺、事故處理、問題管理、變更管理、發布管理、CMDB、知識庫等模塊劃分,運維流程可穿越各個階段進行流轉。
五、IT運維服務管理平臺的實現
(一)IT服務管理基礎平臺的搭建
IT服務管理基礎平臺系統由應用服務器、數據庫服務器、客戶機組成,使用分布式部署,減輕核心服務器的壓力。創建用戶類型、定義安全機制、代碼表配置、組織結構數據建設、人員數據建設、資產數據裝載,制作統計報表。
(二)服務臺建設
數據中心服務臺負責全公司服務請求的處理和轉發,技術上主要是對服務臺工作人員進行培訓,掌握全面的運維知識,熟悉服務臺職責;管理上主要是制定服務臺運維管理制度,明確服務臺人員的工作內容與操作規程。服務臺是用戶申報事故以及獲得事故處理結論的統一入口,主要工作包括以下幾個方面,一是完成響應服務請求,處理常見的運維事件,將不能解決的事件升級;二是發布相關的運維信息,如網絡、ERP業務系統、設備故障等;三是協助提高IT部門事故處理質量,增加用戶滿意度,形成有效的事故處理和跟蹤的手段。
(三)事故管理建設
我們借鑒了IT服務管理的經驗,為了靈活實現運維系統各個流程建設,在實踐中簡化了流程以適應運維工作的需要。在事故處理流程建設中,ITN務管理標準的做法是直接將事故送到服務臺,由服務臺負責處理或者分發,而實際工作中,將業務系統的監控事件直接送到業務管理系統的管理員,服務臺負責監督事故處理完成的情況。
(四)問題管理建設
問題管理管理員直接手工新建問題工單,或者由服務臺或事故管理來觸發問題工單管理流程。當問題由于成本與技術等原因暫不消除時,可定為已知錯誤,后期可繼續處理。找到問題的根本原因,并提供臨時措施與根本解決方案,防止問題再次發生或減少問題的數量。
(五)配置管理建設
配置管理數據庫(CMDB)儲存與管理企業rT架構中設備的各種配置信息,它與所有服務支持和服務交付流程都緊密相聯,一方面支持這些流程的流暢運轉、發揮配置信息的價值;另一方面,幫助技術人員受到服務請求時獲取相關技術支持,同時依賴于相關流程保證數據的準確性。
在建設初期通過配置項自動發現,整個企業IT架構的配置項(cI)導入配置項,為了保證數據的準確、全面、我們要求業務系統、設備等管理人員提供、核對相關數據,保證在運維中能準確利用數據進行運維。
CMDB通過拓撲關聯圖展現各個配置項之間的關聯關系,可以清晰的看到各個硬件、軟件間的關聯關系,也能看到IT配置項和IT服務之間的關聯關系,因此當IT服務出現問題時,可以通過該關聯關系,快速查找IT服務不可用的根本原因。
將配置項和事故記錄、問題記錄、變更記錄和發布記錄相關聯,有利于針對具體的IT設施進行運維優化和改進。
(六)變更管理建設
確保在IT服務變動的過程中能夠有標準的方法,以有效的控制變更,降低或消除因為變更對業務運營所造成的影響與問題。由專家和技術顧問組成,對提交的變更請求(RFC)進行評審,并最終裁定是否批準實施該變更請求。
變更審計管理,通過CMDB定期對配置項進行自動掃描,發現企業IT架構中的非法變更,管理員根據變更的信息,選擇變更恢復或者進入變更流程,幫助管理人員進行變更的審計管理。
(七)發布管理建設
通過正式的流程確保只有經過完整測試與得到授權的軟件與硬件才能夠進入正式運行環境, 以確保變更后生產環境的質量。發布的最終結果將會反映到cMDB中。
(八)知識庫建設
將成熟可行的解決方案錄入知識庫,進行數據共享,快速排除故障,從而達到提高用戶“自助式服務”能力的目的。當運維人員進行事故、問題、變更和發布運維流程時,可以根據不同資源類型, 自動關聯該類型的知識條目,幫助運維人員快速解決問題。知識庫的自身管理,包括建立、審核、分類、評價、訂閱、收藏、搜索知識等,知識需要經過知識庫管理員審核后才能進入知識庫。
六、結束語
通過ITIL在制造業的實踐,實現對IT系統的集中、統一的監控管理,設計和建立基本的IT服務管理流程和技術支撐平臺。IT運維服務管理信息化是信息部門自身工作信息化的一個標志性環節,不但意味著管理的標準化、規范化,也提高了對外的服務能力與質量,提升了運行管理水平及故障應急處理能力,實現了知識經驗的積累和共享,并且把工作量化,為考評提供依據。
實現IT服務管理體系涉及到很多方面,實施過程中要考慮企業的文化特點和對變化的接受能力,立足現有的組織分工和人員結構,分期設計、實施,建立配套的管理制度等。
轉載請注明出處:拓步ERP資訊網http://m.guhuozai8.cn/
本文網址:http://m.guhuozai8.cn/html/consultation/1083932429.html