• 沒有找到結果。

遠端伺服器監控管理系統設計與實作

N/A
N/A
Protected

Academic year: 2021

Share "遠端伺服器監控管理系統設計與實作"

Copied!
13
0
0

加載中.... (立即查看全文)

全文

(1)

遠端伺服器監控管理系統設計與實作

A Design and Implementation for Remote Server

Monitoring and Management System

蕭富方

世新大學資訊管理學系

摘要 為了讓系統管理人員可以更方便管理伺服器,本研究設計系統自動控管各個 功能,當伺服器發生異常情況,為了維持伺服器之正常運作,系統將自動處理異 常狀況,做出相對應的應變措施。實現網路監控程式的功能,架構「遠端伺服器 監控管理系統」。 本研究透過 BMC 進行硬體偵測功能(如 CPU 溫度、風扇轉速、電壓值等), 並能下達指令操作監控硬體狀態。當 CPU 溫度過高或風扇轉速過低時,系統便 將 System fail LED 燈點亮,並發送警示訊息(SNMP trap)至中央管理伺服器。 當 CPU 溫度超過門檻值時,便將風扇轉速加快,使 CPU 降低溫度,風扇轉速隨 著 CPU 溫度而自動調節,使之能達到一個平衡點。 監控系統運行的狀態,獲取系統資訊(如連線狀態、網路流量統計、網路傳 輸流量等),即時連線監控,分析判讀系統資訊,若系統數值超過原先預設之門 檻值,導致主機負載過重,造成伺服器的不穩定或錯誤發生時,系統將發出警示 訊息給中央管理伺服器,由中央管理伺服器採取相對應的應變措施。 系統管理人員能夠遠端監看系統的運行狀況,下達指令操作查看硬體狀態 (如 CPU 溫度、風扇轉速、電壓值)或是系統狀態(如網路流量、網路連線狀 況等)。並能夠遠端控制系統,直接對系統下達指令(如開機、關機、重新開機 等),以便於系統管理人員隨時掌控系統運作情況。 關鍵字:伺服器管理、IPMI、BMC、SNMP。 1.

前言

科技變革腳步快速,資訊發展日新月異,伺服器的需求與日劇增,IDC(國 際數據資訊)報告顯示:「2005 年整體伺服器的銷售額比 2004 年成長 4.4%,達 到 513 億美元。」Gartner(市場觀察機構)於 2006 年發佈的研究報告中指出: 「去年(2005 年)伺服器銷售額擴大 4.5%,成為 495 億美元。」[4] Gartner 並 於 2006 年發表調查報告,指出 2006 年第一季全球伺服器出貨量相較於去年 (2005)年同期成長 13.7%[12]。對於如何有效管理機房眾多的伺服器,儼然成 為系統管理人員的一大課題。大型機房裡數量眾多的伺服器,系統管理人員必須 隨時監控伺服器的情況,以維持機房內伺服器的正常運作。在過去,系統管理人 員為了維持伺服器之正常運作,可能要時時刻刻在現場監視、檢查。現今,網際 網路蓬勃發展,系統管理人員可以透過網路,使用遠端伺服器管理系統去監視、 檢查伺服器。雖然能夠透過遠端管理伺服器系統去監視、檢查伺服器,但面對跨 平臺的系統管理仍是有待解決的議題。

(2)
(3)
(4)

項目 內容 集中 管理 控制 1. 指令操控: 進行遠端監查、控制等功能。 2. 集中管理控制: 透過一台中央管理伺服器實現多台伺服器管理,達到集中控制 管理之目的。透過Fail-Over的機制,確保伺服器對外連線的正 常運作與穩定性。 概括上述系統目標,描繪成下圖之系統功能圖,參見圖 1: 圖1. 系統功能圖

2. 相關理論與技術

2.1 IPMI(Intelligent Platform Management Interface,IPMI)

IPMI(Intelligent Platform Management Interface,IPMI)規格於 1998 年由Intel (英特爾)、Dell(戴爾)、HP(惠普)以及NEC公司所共同提出[14] [18] [19] [21] 。 IPMI提供系統健康狀態監視、對事件的發生能自動發出警告訊息、自動化系統 控制(如切斷電源、關機、重新開機等)以及獲取系統事件日誌記錄和感測器數 據記錄等功能。在事件發生時,IPMI將記錄系統運作情形及事件發生狀況,利 用警示訊息(例如發送SNMP trap)通知系統管理人員,而系統管理人員能夠透 過網路(LAN)或 串列 (Serial)的形式,遠端操作系統讓伺服器恢復正常 [21][22][23]。

(5)

控制器。BMC 作為系統管理軟體與 ICMB 和 IPMB 介面之間的網路閘道使用, 是控制系統的管理軟體和管理硬體之間的介面,通過與 BMC 之通訊可以實現對 各個被管理元件的管理控制。

BMC 提供之功能有:自動監控、事件記錄、訊息警告和恢復控制等功能 [14][18][19][22][23]。BMC 透過主機板上的各個感測器,監控系統上的被管元件 之狀況,能儲存感測器的數據資料(Sensor Data Records,SDR),記錄系統事件。 當 BMC 發現被管元件發生異常情形時,能做出相對應的措施,例如:記錄事件 發生,發出事件警告訊息(例如:SNMP trap),自動恢復控制等。

2.2 SNMP(Simple Network Management Protocol)

網路管理的發展過程,於 1987 年 3 月,由 IETF(Internet Engineering Task Force,美國網路工程師)為 Gateway(閘道器)而發展的網路管理通訊協定。同 年(1987 年)11 月,發展 SGMP (Simple Gateway Management Protocol,簡易 閘道器管理協定)。SGMP 的用途是管理閘道器,減少 Agent(代理者)需回應 的指令數目,降低了管理上的複雜度。

IETF 於 1988 年提出 SNMP(Simple Network Management Protocol,簡易網 路管理協定)[1][10][15]。SNMP 是由 SGMP 而來,目的為定義標準化網路管理 通訊協定與網路管理資料庫(MIB),提供一個良好的系統架構,進行網路上系統 資料的蒐集、系統狀態報告、參數設定或網路使用狀況資料與異常警示等網路管 理功能[8][9][10][15]。SNMP 被廣泛地用來監測及設定現代幾乎所有種類的 TCP ∕IP 裝置,且普通地存在於各種網路平臺上,最常被用來設定及管理一些裝置, 例如路由器、交換器,電腦等等,並提供網路監測的服務[10][15]。

(6)
(7)

3.3 工作原理(如圖 3 所示)

1. 透過BMC獲得主機硬體資訊(例如:CPU溫度、風扇轉速、電壓值、 電源狀態等資訊)。

2. 下達指令,發送Request Message Data。

3. 回傳硬體目前狀態之資訊(例如:CPU溫度、風扇轉速、電壓值、 電源狀態等資訊)。

4. 回傳Response Message Data。

5. 假設目前CPU溫度過高,超過硬體事件發生門檻值,則系統點亮 System fail LED燈,BMC卡發送SNMP trap到中央管理伺服器,待 CPU溫度回覆正常後,才熄滅System fail LED燈,解決事件。

(8)
(9)
(10)
(11)

置[14]。被監控端伺服器若發生事件,造成主機不穩定的狀況時,系統便發送警示訊息 通知中央管理伺服器,由中央管理伺服器利用 Out-of-Bad 的方式遠端開啟另一台關機中 的被監控端伺服器,使用 Fail-Over 的機制,將原本的網路流量導向另一台可用的路線, 以確保整體對外連線的正常運作及穩定性。Fail-Over 的機制是在伺服器發生事件或問題 時,將原本的流量導向其他可用的路線,以維持伺服器能正常提供服務,可確保網路對 外連線之穩定。

(12)

10 進行遠端監察控管之功能,透過一台中央管理伺服器實現多台伺服器管理, 達到集中控制管理之目的。藉由中央管理伺服器偵測被監控端伺服器之網路 連線狀況與系統資訊,當被監控伺服器連線狀況不穩定時,中央管理伺服器 將使用Out-of-Bad的方式遠端開啟另一台關機中的電腦,利用Fail-Over的機 制,將原本的流量導向另一台可用的伺服器,以維持網路對外連線的正常運 作及穩定性。 IPMI 提供系統健康狀態監視、對事件自動發出警告訊息、自動化系統控制(如切斷電 源、關機、重新開機等)以及獲取系統事件日誌記錄和感測器數據紀錄等功能。未來可 以偵測更多系統資訊,配合 IPMI 所能提供之功能,將硬體設備與軟體應用做為結合, 以實現更廣泛之應用。

參考文獻

1. ATEN(2006),宏正自動科技創新IPMI韌體套件獲微星科技AMD系列伺服器採用,宏 正自動科技股份有限公司, http://www.aten.com.tw

2. Avocent(1990), An Introduction to the Intelligent Platform Management Interface Case, J.D., “Management of high speed networks with the simple network management protocol(SNMP)", Local Computer Networks, Proceedings 3. CNW(2004),IPMI伺服器管理規範向前邁進, CNW網界http://cnw2005.cnw.com.cn 4. Avocent (2002),http://www.avocent.com/web

5. Hugo Caçot(2004), IPMI Server Management, http://it-dep-fio-ds.web.cern.ch/

6. Ilia Stolov(2002),高性價比的IPMI遠程管理方案, http://www.eettaiwan. com/ 7. Intel(2005), IPMI v2.0 specification, http://www.intel.com/des

8. IPMItool(2005), ipmitool manpage, http://ipmitool.sourceforge.net/ 9. Networksorcery(2005), SNMP, Simple Network Management Protocol,

http://www.networksorcery.com/

10. Sun Microsystems(2005),IPMI 參考資訊,http://docs.sun.com/source/ 11. Sun Microsystems(2005),關於 IPMI,http://docs.sun.com/source/

12. Yung-Chin Fang, Garima Kochhar, Randy Deroeck and Dell(2005),運用智慧型 平 臺 管 理 介 面 ( IPMI ) 管 理 與 監 控 高 效 能 運 算 叢 集 , http://tech.digitimes.com.tw/ 13. 中 國 協 議 分 析 網 (2005) , SNMP 的 5 種 協 議 數 據 單 元 , http://www.chinaitpower.com/A200508/2005-08-02/182209.html 14. 中國計算機報社(2003),IPMI方便交叉平臺的管理,http://media.ccidnet.com/ 15. 林軒立(2003),SNMP網路管理觀念介紹及實作練習, 立百代事業技術專文 , http://www.leetide.net/

(13)

參考文獻

相關文件

EtherCAT ® 為德國 Beckhoff Automation GmbH 取得許可證之專利技術,亦為註冊商標。. EtherNet/IP™為

專案導向應用程式開發 階梯程式編輯畫面 狀態的監視與控制 階梯程式助憶碼輔助顯示 階梯程式註解功能

FPPA 是 Filed Programmable Processor Array 的縮寫,簡 單的說:它就是一個可以平行處理的多核心單晶片微控器。與一般 微控器如 8051、pic,…

可程式控制器 (Programmable Logic Controller) 簡稱 PLC,是一種具有微處理機功能的數位電子 設備

數位計算機可用作回授控制系統中的補償器或控制

最後特別提出說明,本研究用戶端作業系統為 Win 2000 Professional,伺服 器端作業系統為 Windows 2000 Server 並啟動 Active Directory

圖4 1 整合資訊系統風險 圖4.1 整合資訊系統風險..

本簡報旨在就常見的貪污風險及防貪措施提供一般介紹,而不會對各種情