本節說明本研究系統實作目標、自動化事件管理架構與設計與研 究範圍、限制。
3.1.1 系統實作目標
本研究以 ITIL 中的事件管理流程為研究對象,建構符合 ITIL 事 件管理流程的指引與需求,且將事件管理所需活動內容,在可進行自 動化的步驟上,如圖 14 事件管理活動中的前四項活動(Detection、
Recording、Classification 與 Diagnosis),探討運用相關技術與方式建 構此系統,並提供 Web 管理介面給服務台人員查詢運用。
圖 14 本研究針對事件管理的前四項活動進行自動化 資料來源:本研究整理
3.1.2 系統架構與流程設計
本研究的系統架構圖如圖 15 所示,系統透過四個主要的代理人 (Agent)來進行事件管理自動化系統的資料處理:
圖 15 系統架構圖 資料來源:本研究
1. 事件偵測代理人:負責偵測 IT 服務相關伺服器的服務與資源運 作狀態,狀態包含程序(Process)、日誌檔(伺服器、資料庫、應用 程式等)、物件網路回應、伺服器 CPU、伺服器記憶體與伺服器 磁碟使用狀況等狀態,發現程序不存在於系統或是 Ping 物件無 回應等等異常資訊。
2. 組態管理代理人:負責收集與稽核物件組態的狀態。組態收集程 式根據收集的組態清單,進行物件組態資料的檢查與收集,並存 放所取得的組態值至組態資料庫中。另外,物件若有組態異動狀 況,組態稽核程式便會回報此物件組態異動資訊到物件組態庫 中,並保留組態異動狀態資料,供服務台查詢物件組態異動前與 異動後的設定值。
3. 事件關聯代理人:程式根據事先於本研究中所定義的 SEC 規則 進行事件關聯處理。事件關聯程式會根據設定的事件規則,過濾 與判定此事件的影響範圍、等級與嚴重程度,然後根據規則發送 Email 通知管理者,並儲存關聯處理後的事件資料至事件資料 庫。
4. 事件檢索代理人:負責處理事件相似度資訊,並進行事件相似度 比對。事件資訊檢索代理人取得經事件關聯處理後的新事件資 料,便進行此新事件的檢索處理,一開始先將新事件的資訊去除 停用字與進行索引處理,接下來會檢索先前已發生過,且被定義 為可利用之事件資料知識庫(Known Error DB)中的事件資料,這 些事件資料是由 IT 管理者妥善處理曾發生、已解決並有事件解 決方式的事件資料資訊,代理人依據相似度計算公式,進行新事 件與事件知識庫中資料的索引比對,再將相似程度最高的前三筆 事件知識庫的資訊,回應至事件資料庫中的新事件資料。
系統整體架構流程設計以下列五個主要步驟來進行,其中包含將 ITIL 定義的事件管理如偵測、記錄、分類與診斷等活動自動化範圍:
步驟一:由事件偵測代理人定期自動進行 IT 服務相關物件的事件偵 測,若有偵測到異常事件,便將事件資料傳遞給事件關聯步 驟進行處理。此步驟可達成事件管理活動中,對於 IT 服務 的 Detection 活動自動化。
步驟二:事件關聯代理人接收事件偵測代理人所傳遞的事件資料後,
進行事件資料的關聯與分類處理,依定義規則將事件處理完 成後,便將事件資料記錄到事件資料庫,並寄送 Email 給相 關的 IT 管理人員,接著將事件交由事件檢索代理人進行檢 索處理。此步驟可達成事件管理活動中的 Classification 與 Recording 活動的自動化。
步驟三:事件檢索代理人取得經事件關聯代理人處理的新事件後,進 行新事件的檢索處理,再將相似度最高的前三筆已知問題事 件知識資訊更新至事件資料庫中的新事件資料。此步驟可達 成事件管理活動中 Diagnosis 步驟的自動化。
步驟四:服務台人員透過事件管理平台,從 Web 介面檢視 IT 服務異 常事件,取得造成異常問題的物件問題根源,同時取得新事 件的解決方案。而經由組態管理代理人取得的組態資料與組 態異動稽核資料,也可經由事件管理平台來檢視與運用。
步驟五:新事件處理完成後,IT 管理者透過事件管理平台進行新事 件知識處理,若此新事件是用現有的事件知識資料解決方式 處理完成,則透過事件管理平台將此事件結案;若此新事件 是以前未曾有過的經驗,或沒有適用的解決方式,則可經由 管理平台將此新事件存入事件知識資料庫,此時事件檢索程
式便會將此事件知識資料進行索引處理,作為日後新事件的 比對使用。
本研究架構後端資料庫中存放的 CMDB 資料,內容包含組態資 料、IT 服務物件、事件與已知問題處理資訊等等。事件管理平台為 資料呈現的介面,是從 CMDB 資料庫取得資料並提供使用者檢視與 操作。事件管理平台的 Web 介面,是以 IT 服務為觀點,IT 服務底 下的物件若有異常,問題根源的物件處會產生異常訊息的資料,影響 範圍是利用 Bottom-Up 方式,由異常物件往上影響到所有相關聯的物 件,一直到最上層物件,也就是使用者所使用的 IT 服務。IT 服務相 關物件關係與物料清單(BOM)結構方式一樣,可從成品階依序展開下 階料件,直到展開最底層的料件為止。
3.1.4 研究範圍與限制
本研究主要為探討 ITIL 事件管理自動化,另有部分組態管理的 CMDB 範圍,其他 ITIL 功能領域未進一步深入討論。事件管理偵測 之研究範圍限定於 IT 服務中由系統自動偵測的事件,未包含 ITIL 事 件管理中的其他事件來源,如使用者提出需求或使用者回報錯誤等 等。使用者回報的錯誤,有部分屬於客戶端軟體使用問題,如個人電 腦故障或 Office 軟體使用異常問題等等,不屬於本研究的範圍,其他 使用者回報的 IT 服務異常錯誤,皆屬於本研究自動偵測所涵蓋範圍 內,本研究以主動式進行自動偵測事件的處理,可更快速解決問題。
為符合低成本、跨平台與設定簡易需求,本研究使用開放原始碼 (Open Source)的 SEC 軟體來建構與處理事件關聯,未採用商業型事 件關聯處理器,因 SEC 是為採用 Rule-based 的事件關聯器建置,故
理的規則。
另外,因事件檢索是以曾發生過的事件知識資料做相似度比對依 據,故本系統需先取得或建置歷史事件資料,事件檢索部分的運作才 能發揮功能。